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= (54) Title: NOVEL SELECTION METHOD 

(54) Bezeichnung: NEUE SELEKTIONSVERFAHREN 

(57) Abstract: The invention relates to methods for producing transformed plant cells or organisms by transforming a population 
of plant cells comprising at least one marker protein having a directly or indirectly toxic effect therefor, by means of at least one 
nucleic acid sequence to be inserted, said sequence being combined with at least one compound preferably a DNA construct which 

^ is able to reduce the expression, quantity, activity and/or function of the marker protein. The transformed plant cells have a growth 

^5 advantage in relation to the non-transformed cells as a result of the action of said compound. 

*y (57) Zusammenfassung: Die vorliegende Erfindung betrifft Verfahren zur Herstellung transformierter pflanzlicher Zellen oder Or- 
ganismen durch Transformation einer Population pflanzlicher Zellen, die mindestens ein Markerprotein mit einem fur diese direkt 
oder indirekt toxischen Effekt umfasst, mit mindestens einer zu insertierenden Nukleinsauresequenz in Kombination mit mindes- 
tens einer Verbindung - bevorzugt einem DNA-Konstrukt - befahigt zur Verminderung der Expression, Menge, Aktivitat und/oder 

£^ Funktion des Markerproteins, wobei die transformierten pflanzlichen Zellen infolge der Wirkung besagter Verbindung gegeniiber 
nicht-transformierten Zellen einen Wachstumsvorteil haben. 
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Neue Selektionsverfahren 
Beschreibung 

5 

Die vorliegende Erfindung betrifft Verfahren zur Herstellung 
trans formierter pflanzlicher Zellen oder Organismen durch Trans- 
formation einer Population pflanzlicher Zellen, die mindestens 
ein Markerprotein mit einem fur diese direkt oder indirekt 

10 toxischen Effekt umfasst, mit mindestens einer zu insertierenden 
Nukleinsauresequenz in Kombination mit mindestens einer Ver- 
bindung - bevorzugt einem DNA-Konstrukt - befahigt zur Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins , wobei die trans formier ten pflanzlichen Zellen 

15 infolge der Wirkung besagter Verbindung gegenuber nicht-trans- 
formierten Zellen einen Wachstumsvorteil haben. 

Die Einftihrung genetischen Materials in Zielzellen gelingt meist 
• nur in einer sehr begrenzten Anzahl von Zellen einer Population. 

20 Dies macht die Unterscheidung und Isolierung von erfolgreich 
transformierten von nicht-transf ormierten Zellen erf orderlich, 
ein Verfahren das als Selektion bezeichnet wird. Traditionell 
erfolgt die Selektion mittels einer sogenannten positiven 
Selektion, wobei die transf ormierte Zelle in die Lage versetzt 

25 wird, zu wachsen und zu iiberleben, wohingegen die untrans- 
f ormierte Zelle im Wachstum gehemmt oder abgetdtet wird 
(McCormick et al. (1986) Plant Cell Reports 5:81-84). Ublicher- 
weise wird eine derartige positive Selektion durch Gene reali- 
siert, die fur eine Resistenz gegen ein Biozid kodieren (z.B. 

30 ein Herbizid wie Phosphinothricin, Glyphosat oder Bromoxynil, 
einen Metabolismusinhibitor wie 2-Desoxyglucose-6— phosphat 
(WO 98/45456) oder ein Antibiotikum wie Tetracyclin, Ampicillin, 
Kanamycin, G 418, Neomycin, Bleomycin oder Hygromycin) . Derartige 
Gene werden auch als positive Selektionsmarker bezeichnet. Der 

35 positive Selektionsmarker wird gekoppelt (physikalisch oder 

mittels Cotrans formation) mit der in das Zellgenom einzuf iihrenden 
Nukleinsauresequenz in die Zelle eingebracht. AnschlieSend werden 
die Zellen auf einem Medium unter dem entsprechenden Selektions- 
druck (z.B. in Gegenwart eines entsprechenden Antibiotikums oder 

40 Herbizids) kultiviert, wodurch die transformierten Zellen auf- 
grund der erworbenen Resistenz gegen besagten Selektionsdruck 
einen Wachstums-/Uberlebensvorteil haben und so selektioniert 
werden kdnnen. Beispielhaft als positive Selektionsmarker seien 
genannt : 
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Phosphinothricinacetyltransferasen (PAT) (auch Bialophos®- 
Resistenz; bar) acetylieren die freie Aminogruppe des 
Glutaminsynthaseinhibitors Phosphinothricin (PPT) und 
erreichen damit eine Detoxif izierung (de Block et al. (1987) 
5 EMBO J 6:2513-2518; Vickers JE et al . (1996) Plant Mol Biol 

Reporter 14:363-368; Thompson CJ et al . (1987) EMBO J 
6:2519-2523) . 

5-Enolpyruvylshikimat-3-phosphatsynthasen (EPSPS) verleihen 

10 eine Resistenz gegen das unselektive Herbizid Glyphosat® 

(N-(Phosphonomethyl)glycin; Steinrucken HC et al . (1980) 
Biochem Biophys Res Conimun 94:1207-1212; Levin JG und Sprin- 
son DB (1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode 
of action of glyphosate; A literature analysis, p. 48-74. In: 

15 Grossbard E und Atkinson D (eds.) The herbicide glyphosate. 

Buttersworths, Boston.). Glyphosat-tolerante EPSPS Varianten 
zur Verwendung als Selektionsmarker sind beschrieben (Pad- 
gette SR et al . (1996). New weed control opportunities: deve- 
lopment of soybeans with a Roundup Ready™ gene. In: Herbicide 

20 Resistant Crops (Duke SO, ed.), pp. 53-84. CRC Press, Boca 

Raton, FL; Saroha MK und Malik VS (1998) J Plant Biochemistry 
and Biotechnology 7:65-72; Padgette SR et al.(1995) Crop 
Science 35 (5) : 1451-1461; US 5,510,471; US 5,776,760; 
US 5,864,425; US 5,633,435; US 5,627;061; US 5,463,175; 

25 EP-A 0 218 571) . 



- Neomycinphospho trans f erasen verleihen eine Resistenz gegen 
Aminoglykosid-Antibiotika wie Neomycin, G418, Hygromycin, 
Paromomycin oder Kanamycin, indem sie durch eine Phosphory- 
30 lierungsreaktion deren inhibierende Wirkung reduzieren (Beck 

et al. (1982) Gene 19:327-336). 



2-Desoxyglukose-6-phosphatphosphatasen verleihen eine 
Resistenz gegen 2-Desoxyglukose (EP-A 0 807 836; Randez-Gil 
35 et al. (1995) Yeast 11:1233-1240; Sanz et al . (1994) Yeast 

10:1195-1202) . 

Acetolactatsynthasen verleihen eine Resistenz gegen 
Imidazolinon/Sulf onylharnstof f-Herbizide (z .B. Imazzamox, 
40 Imazapyr, Imazaquin, Imazethapyr, Amidosulf oron, Azim- 

sulfuron, Chlorimuronethyl , Chlorsulf uron; Sathasivan K 
et al. (1990) Nucleic Acids Res 18(8):2188). 

Daruber hinaus sind Resistenzgene gegen die Antibiotika Hygro- 
45 mycin (Hygromycinphosphotransf erasen) , Chloramphenicol (Chloram- 
phenicolacetyltransf erase) , Tetracyclin, Streptomycin, Zeocin und 
Ampicillin (^-Lactamase Gen; Datta N, Richmond MH. (1966) Biochem 
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J 98(1) : 204-9) beschrieben. 

Gene wie die Isopentenyltransf erase (ipt) aus Agrobacterium tume- 
faciens (strain:P022) (Genbank Acc.-No. : AB025109) konnen eben- 
5 falls als Selektionsmarker eingesetzt werden. Das ipt Gen ist 
ein Schliisselenzym der Cytokin-Biosynthese . Seine Uberexpression 
erleichtert die Regeneration von Pflanzen (z.B. Selektion auf 
Cytokin-freiem Medium) (Ebinuma H et al. (2000) Proc Natl Acad 
Sci USA 94:2117-2121; Ebinuma H et al. (2000) Selection of 
Marker-free transgenic plants using the oncogenes (ipt, rol A, B, 
C) of Agrobacterium as selectable markers, In Molecular Biology 
of Woody Plants. Kluwer Academic Publishers) . Nachteilig ist hier 
zum einen, dass der Selektionsvorteil auf meist subtilen Unter- 
schieden in der Zellprolif eration beruht, zum anderen die Pflanze 
15 durch die Transformation mit einem Onkogen unerwunschte Eigen- 
schaften (Galltumorbildung) erhalt. ■ 



20 



Verschiedene weitere positive Selektionsmarker sind in 
EP-A 0 601 092 beschrieben. Beispielhaft sind zu nennen: 
|3-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose). 
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Negative Selektionsmarker werden zur Selektion von Organismen mit 
erfolgreich deletierten Marker sequenzen eingesetzt (Koprek T et 
al. (1999) Plant J 19 (6) :719-726) . In Gegenwart eines negativen 
Selektionsmarkers wird die entsprechende Zelle abgetotet oder er- 
f ahrt einen Wachstumsnachteil . Bei der negativen Selektion wird 
beispielsweise durch den in die Pflanze eingebrachten negativen 
Selektionsmarker eine Verbindung, die ansonsten fur die Pflanze 
keine nachteilige Wirkung hat, in eine Verbindung mit nach- 
teiliger (d.h. toxischer) Wirkung umgesetzt. Beispiele fur nega- 
tive Selektionsmarker umfassen: Thymidinkinase (TK) z.B. des Her- 
pes Simplex Virus (Wigler et al. (1977) Cell 11:223), zellulare 
Adeninphosphoribosyl transferase (APRT) (Wigler et al . (1979) Proc 
Natl Acad Sci USA 76:1373), Hypoxanthinphosphoribosyltransf erase 
(HPRT) (Jolly et al. (1983) Proc Natl Acad Sci USA 80:477), 
Diphtheria Toxin A Fragment (DT-A) , die bakterielle Xanthin- 
Guaninphosphoribosyltransf erase (gpt; Besnard et al . (1987) Mol. 
Cell. Biol. 7:4139; Mzoz and Moolten (1993) Human Gene Therapy 
40 4:589-595), das codA Genprodukt kodierend far eine Cytosinde- 
aminase (Gleave AP et al . (1999) Plant Mol Biol. 40 (2) : 223-35 ; 
Perera RJ et al . (1993) Plant Mol Biol 23(4): 793-799; Stougaard 
J; (1993) Plant J 3:755-761; EP-Al 595 873), das Cytochrom P450 
Gen (Koprek et al. (1999) Plant J 16:719-726), Gene kodierend fur 
45 eine Haloalkandehalogenase (Naested H (1999) Plant J 18:571-576), 
das iaaH Gen (Sundaresan V et al. (1995) Genes & Development 
9:1797-1810) oder das tms2 Gen (Fedoroff NV & Smith DL (1993) 
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Plant J 3: 273-289) . Die negativen Selektionsmarker werden meist 
in Kombination mit sogenaimten "Prodrugs" oder u Pro-Toxinen" 
eingesetzt, Verbindungen die durch die Aktivitat des Selektions- 
markers in Toxine umgesetzt werden. 

5 

5-Methylthioribose- (MTR) -kinase ist ein Enzym, dessen enzymati- 
sche Aktivitat nicht in Saugern, wohl aber in Pflanzen, Bakterien 
und Protozoen beschrieben ist. Das Enzym kann ein MTR-Analog 
( 5- (Trif luoromethyl ) thioribose) als sogenanntes "subversives 
10 Substrat" des Methionin-Ausweich-Stof fwechselwegs ("Salvage Path- 
way") aber ein instabiles Intermediat zu der toxischen Verbindung 
Carbothionyldifluorid umsetzen. 

Besagte Selektionssysteme haben verschiedene Nachteile. Der 

15 eingebrachte Selektionsmarker (z.B. Antibiotikaresistenz) 

hat seine Berechtigung allein wahrend der Transformation und 
Selektion stellt jedoch spater ein in der Regel unnotiges und 
oft auch unerwiinschtes Proteinprodukt dar. Dies kann aus Griinden 
der Verbraucherakzeptanz und/oder der Zulassung als Lebens- 

20 und/oder Futtermittel unvorteilhaf t sein. Nachteilig ist in 
diesem Zusammenhang ferner, dassMer zur Selektion verwendete 
Selektionsmarker in der Regel genetisch mit der in das Genom zu 
insertierenden Nukleinsauresequenz gekoppelt ist und nicht durch 
Segregation im Rahmen der Vermehrung oder Kreuzung entkoppelt 

25 werden kann. In der Regel ist eine Deletion der Markersequenz 

erforderlich, was zusatzliche Arbeitsschritte erfordert. Daruber- 
hinaus erfordern biotechnologische Arbeiten in zahlreichen Fallen 
eine Mehrf ach trans format ion mit verschiedenen Genkonstrukten . 
Hier ist fur jeden Trans formations schritt ein neuer Selektions- 

30 marker erforderlich, wenn nicht der zuvor verwendete zunachst 
muhsam deletiert werden soil. Dies erfordert jedoch eine breite 
Palette gut funktionie render Selektionsmarker, die fur die 
meisten pflanzlichen Organismen nicht zur Verftigung stehen. 

35 Es stellte sich folglich die Aufgabe, neue Selektionsverf ahren 

zur Selektions trans formierter pflanzlicher Zellen und Organismen 
bereitzustellen, die moglichst die Nachteile der vorhandenen 
Systeme nicht mehr aufweisen. Diese Aufgabe wird durch die vor- 
liegende Erfindung gelost. 
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Ein erster Gegenstand der Erfindung betrifft ein Verf ahren zur 
Herstellung trans formierter pflanzlicher Zellen oder Organismen 
umfassend nachfolgende Schritte: 



45 a) Transformation einer Population pflanzlicher Zellen, wobei 
die Zellen besagter Population mindestens ein Markerprotein 
enthalten, das fur besagte population direkt oder indirekt 
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einen toxischen Effekt bewirken kann, mit mindestens einer 
zu insertierenden Nukleinsauresequenz in Kombination mit 
mindestens einer Verbindung befahigt zur Verminderung der 
Expression, Menge, Aktivitat und/oder Funktion mindestens 
5 eines Markerproteins , und 

b) Selektion von trans formier ten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
infolge der Wirkung besagter Verbindung gegenuber nicht - 
10 trans formierten Zellen einen Wachstumsvorteil haben, aus 

besagter Population pflanzlicher Zellen, wobei die Selektion 
unter Bedingungen durchgefiihrt wird, bei denen das Marker- 
protein seinen toxischen Effekt auf die nicht trans formierten 
Zellen ausuben kann. 

15 

In einer bevorzugten Aus fuhrungs form ist das Markerprotein 
ein Protein, dass in der Lage ist, eine fur besagte Population 
pflanzlicher Zellen nicht-toxische Substanz X in eine fur besagte 
Population toxische Substanz Y direkt oder indirekt umzusetzen. 
20 Das erf indungsgema£e Verfahren umfasst in diesem Fall bevorzugt 
nachf olgende Schritte: 

a) Transformation der Population pflanzlicher Zellen mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 

25 Kombination mit mindestens einer Verbindung befahigt zur 

Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion mindestens eines Markerproteins , und 

b) Behandlung besagter Population pflanzlicher Zellen mit der 
30 Substanz X in einer Konzentration, die infolge der Umsetzung 

durch das Markerprotein einen fur nicht-transf ormierte Zellen 
toxischen Effekt bedingt, und 

c) Selektion von trans formierten pflanzlichen Zellen, die in 

35 ihrem Genom besagte insertierte Nukleinsauresequenz aufweisen 

und die infolge der Wirkung besagter Verbindung gegenuber 
nicht-transformierten Zellen einen Wachstumsvorteil auf- 
weisen, aus besagter Population pflanzlicher Zellen, wobei 
die Selektion unter Bedingungen durchgefiihrt wird, bei denen 

40 das Markerprotein seinen toxischen Effekt auf die nicht 

trans formierten Zellen ausuben kann. . 

Bevorzugt handelt es sich bei der nicht-toxischen Substanz X urn 
eine Substanz, die natiirlicherweise in pflanzlichen Zellen oder 
45 Organismen nicht oder nur in Konzentration vorkommt, die im 

wesentlichen keinen toxischen Effekt bewirken konnen. Bevorzugt 
wird die nicht-toxische Substanz X im Rahmen des erfindungs- 
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gemaSen Verfahrens exogen z.B. tiber das Medium oder das wachs- 
tumssubstrat appliziert. 

Der Begriff "Verbindung befahigt zur Verminderung der Expression, 
5 Menge, Aktivitat und/oder Funktion mindestens eines Marker- 
proteins" ist breit zu verstehen und meint allgemein alle Ver- 
bindungen, die direkt oder indirekt, alleine oder in Kooperation 
mit anderen Faktoren eine Verminderung der Proteinmenge, RNA- 
Menge, Genaktivitat , Proteinaktivitat - oder funktion mindestens 

10 eines Markerproteins bewirken. Besagte Verbindungen sind infolge 
auch unter der Bezeichnung "anti-Markerprotein" -Verbindungen 
zusammengefasst . Der Begriff "anti-Markerprotein"-Verbindung 
schliefct insbesondere - jedoch nicht einschrankend - die im 
Rahmen des erf indungsgemafcen Verfahren in den bevorzugten Aus- 

15 fuhrungsf ormen zum Einsatz kommenden Nukleinsauresequenzen, 
Ribonukleinsauresequenzen, doppelstrangigen Ribonukleinsaure- 
sequenzen, antisense-Ribonukeinsauresequenzen, Expressions - 
kassetten. Peptide, Proteine oder andere Faktoren ein. 

20 In einer bevorzugten Ausfiihrungsf orm meint "anti-Markerprotein"- 
Verbindung ein DNA-Konstrukt umfassend 

a) mindestens eine Expressionskassette geeignet zur Expression 
einer Ribonukleinsauresequenz und/oder - gegebenenf alls - 

25 eines Proteins, wobei besagte Nukleinsauresequenz und/oder 

Protein in der Lage ist, die Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins zu vermindern, oder 

b) mindestens eine Sequenz, die eine teilweise oder voll- 

30 standige Deletion oder Inversion der Sequenz kodierend fur 

besagtes Markerprotein bewirkt und so eine Verminderung 
der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins ermoglicht, sowie - gegebenenf alls - weitere 
Funktionselemente, die besagte Deletion oder Inversion 

35 erleichtern und/oder fordern, oder 

c) mindestens eine Sequenz, die eine Insertion in die Sequenz 
kodierend fur das besagte Markerprotein bewirkt und so eine 
Verminderung der Expression, Menge, Aktivitat und/oder 

40 Funktion des Markerproteins ermoglicht, sowie - gegebenen- 

falls - weitere Funktionselemente, die besagte Insertion 
erleichtern und/oder fordern. 

Das erf indungsgema&e Verfahren hebt die negativ-selektive 
45 Wirkung des Markerproteins auf . Insofern wirkt eine "anti- 

Markerprotein" -Verbindungen direkt (z.B. liber die Inaktivierung 
mittels Insertion in das Gen kodierend fur das Markerprotein) 
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oder indirekt (z.B. mittels der durch die Expressionskassette 
exprimierten Ribonukleinsauresequenz und/oder gegebenenf alls 
des davon translatierte Proteins) als positiver Selektionsmarker . 
Das erfindungsgem££e Selektionssytem sei infolge als "reverses 
5 Selektionssystem" bezeichnet, da es die negativ-selektive Wirkung 
des Markerproteins "revertiert" . 

Das erf indungsgemaSe Verfahren bedeutet eine sprunghafte Ver- 
breiterung des Repertoirs an positiven Selektionsverf ahren zur 
10 Selektion trans formierter pflanzlicher Zellen. 

Vorteilhaft ist ferner, dass in bestimmten, bevorzugten Aus- 
fuhrungsform (z.B. durch Wirkung einer doppelstrangigen oder 
antisense RNA) der Selektionsef f ekt ohne Expression eines Fremd- 
15 proteins realisiert werden kann (s.u.). 

Vorteilhaft ist dariiber hinaus, dass das zur Selektion indirekt 
verwendete Markerprotein (z.B. der negative Selektionsmarker) 
nicht genetisch mit der in das Genom zu insertierenden Nuklein- 
20 sauresequenz gekoppelt ist. Im Unterschied zu den ansonsten 
ublichen Selektionsverf ahren kann das Markerprotein - wenn es 
sich um ein Transgen handelt - durch einfache Segregation im 
Rahmen nachf olgender Vermehrung oder Kreuzung entfemt werden. 

25 "Pflanzliche Zelle" meint im Rahmen der vorliegenden Erfindung 
jegliche Art von Zelle, die von einem pflanzlichen Organismus 
abgeleitet oder in diesem vorhanden ist. Der Begriff umfasst 
dabei beispielhaft Protoplasten, Kallus- oder Zellkulturen, 
Mikrosporen, Pollen, Zellen in Form von Geweben wie BlSttern, 

30 Meristem, Bliiten, Embryonen, Wurzeln usw. Insbesondere sind all 
solche Zellen und Zellpopulationen umfasst, die sich als Ziel- 
geweben fur eine Transformation eignen. 

"Pflanzlicher Organismus" umfasst dabei jeden Organismus, der 
35 zur Photosynthese befahigt ist, sowie die von diesem abgeleitete 
Zellen, Gewebe, Teile oder Vermehrungsgut (wie Samen oder 
Friichte) . Eingeschlossen sind im Rahmen der Erfindung alle 
Gattungen und Arten hoherer und niedrigerer Pflanzen des 
Pflanzenreiches. Einjahrige, mehrjahrige , monocotyledone und 
40 dicotyledone Pflanzen sowie Gymnospermen sind bevorzugt. 

"Pflanze" im Rahmen der Erfindung meint alle Gattungen und 
Arten hoherer und niedrigerer Pflanzen des Pflanzenreiches. 
Eingeschlossen unter dem Begriff sind die reifen Pflanzen, Saat- 
45 gut, Sprossen und Keimlinge, sowie davon abgeleitete Teile, Ver- 
mehrungsgut (zum Beispiel Knollen, Samen oder Friichte) , Pflanzen- 
organe, Gewebe, Protoplasten, Kallus und andere Kulturen, zum 
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Beispiel Zellkulturen, sowie alle anderen Arten von Gruppierungen 
von Pflanzenzellen zu funktionellen oder strukturellen Einheiten. 
Reife Pflanzen meint Pflanzen zu jedem beliebigen Entwicklungs- 
stadium jenseits des Keimlings . Keimling meint eine junge, 
5 unreife Pflanze in einem fruhen Entwicklungsstadium. "Pflanze" 
umfasst alle einjahrigen und mehrj&hrige, monokotyledonen und 
dikotyledonen Pflanzen und schliefct beispielhaft jedoch nicht 
einschrankend solche der Gattungen Cucurbita, Rosa, Vitis, 
Juglans, Fragaria, Lotus, Medicago, Onobrychis, Tri folium, 

10 Trigonella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus, 
Arabidopsis, Brassica, Raphanus , Sinapis, Atropa, Capsicum, 
Datura, Hyoscyamus, Lycopersicon, Nicotiana, Solarium, Petunia, 
Digitalis, Majorana, Cichorium, Helianthus, Lactuca, Bromus, 
Asparagus, Antirrhinum, Heterocallis , Nemesis, Pelargonium, 

15 Panieum, Pennisetum, Ranunculus, Senecio, Salpiglossis , Cucumis, 
Browaalia, Glycine, Pisum, Phaseolus, Lolium, Oryza, Zea, Avena, 
Hordeum, Secale, Triticum, Sorghum, Picea und Populus ein. 

Bevorzugt sind Pflanzen nachf olgender Pf lanzenf amilien: Amaranth- 
20 aceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae, 
Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae, 
Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, 
Rubiaceae , Saxif ragaceae , Scrophulariaceae , Solanacea , 
Sterculiaceae , Tetragoniacea , Theaceae , Umbellif erae . 

25 

Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
den monokotylen Kulturpf lanzen, wie zum Beispiel der Familie der 
Gramineae wie Alfalfa, Reis, Mais, Weizen oder andere Getreide- 
arten wie Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem 
30 Zuckerrohr sowie alien Arten von Grasern. 

Bevorzugte dikotyle Pflanzen sind insbesondere ausgewahlt aus den 
dikotylen Kulturpf lanzen, wie zum Beispiel 

35 - Asteraceae wie Sonnenblume , Tagetes oder Calendula und andere 



- Compositae, besonders die Gattung Lactuca, ganz besonders die 
Art sativa (Salat) und andere mehr, 



- Cruciferae, besonders die Gattung Brassica, ganz besonders 
die Arten napus (Raps), campestris (Rube) , oleracea cv Tastie 
(Kohl) , oleracea cv Snowball Y (Blumenkohl) und oleracea cv 
Emperor (Broccoli) und weitere Kohlarten; und der Gattung 
45 Arabidopsis, ganz besonders die Art thaliana sowie Kresse 
oder Canola und andere mehr, 



mehr, 



40 
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- Cucurbitaceae wie Melone,. Kurbis oder Zucchini und andere mehr, 

- Leguminosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) sowie Alfalfa, Erbse, Bohnengewachsen oder 

5 Erdnuss und andere mehr 

- Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf f estrauch) und 
andere mehr, 

10 

- Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
die Art esculentum (Tomate) , die Gattung Solanum, ganz beson- 
ders die Art tuberosum (Kartoffel) und melongena (Aubergine) 
und die Gattung Capsicum, ganz besonders die Art annum (Pfef- 

15 fer) sowie Tabak und andere mehr, 

- Sterculiaceae, bevorzugt der Unterklasse Dilleniidae wie bei- 
spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

20 - Theaceae, bevorzugt der Unterklasse Dilleniidae wie beispiels- 
weise Camellia sinensis oder Thea sinensis (Teestrauch) und 
andere mehr, 

- Umbelliferae, besonders die Gattung Daucus (ganz besonders 
25 die Art carota (Karrotte) ) und Apium (ganz besonders die Art 

graveolens dulce (Sellerie)) und andere mehr; 

sowie Lein, Baumwolle, Hanf, Flachs, Gurke, Spinat, Mohre, 
Zuckerriibe und den verschiedenen Baum-, Nuss- -und Weinarten, 
30 insbesondere Banane und Kiwi. 

Pflanzliche Organismen im Sinne der Erfindung sind weiterhin 
weitere photosynthetisch aktive befahigte Organismen, wie zum 
Beispiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
35 Grunalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylum tricornatum, Volvox oder Dunaliella. Insbesondere 
bevorzugt ist Synechocystis . 

Besonders bevorzugt ist die Gruppe der Pflanzen bestehend aus 
40 Weizen, Hafer, Hirse, Gerste, Roggen, Mais, Reis, Buchweizen, 

Sorghum, Triticale, Dinkel, Leinsamen, Zuckerrohr, Raps, Kresse, 
Arabidopsis, Kohlarten, Soja, Alfalfa, Erbse, Bohnengewachsen, 
Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, Paprika, Sonnen- 
blume, Tagetes, Salat, Calendula, Melone, Kurbis und Zucchini. 

45 
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Am meisten bevorzugt sind 

a) Pflanzen, die zur Olproduktion geeignet sind, wie beispiels- 
weise Raps, Sormenblume , Sesam, Farberdistel (Carthamus 
tinctorius), Olbaum, Soja, Mais, Erdnuss, Rizinus, Olpalme, 
Weizen, Kakaostrauch oder verschiedene Nussarten wie bei- 
spielsweise Walnuss, Kokosnuss oder Mandel. Unter diesen 
wieder besonders bevorzugt sind dikotyledonen Pflanzen, ins- 
besondere Raps, Soja und Sonnenblume. 

b) Pflanzen, die der Starkeproduktion di enen, wie beispielsweise 
Mais, Weizen oder Kartoffel. 

c) Pflanzen, die als Nahrungs- und/oder Futtermittel und/oder 
15 Nutzpflanze genutzt werden und bei denen eine Resistenz gg. 

Pathogene vorteilhaft ware, wie beispielsweise Gerste, 
Roggen, Reis, Kartoffel, Baumwolle, Flachs, Lein. 

d) Pflanzen, die zur Produktion von Feinchemikalien wie bei- 
20 spielsweise Vitaminen und/oder Carotinoiden dienen konnen, 

wie beispielsweise Raps . 

"Population pflanzlicher Zellen" meint jegliche Gruppe von 
pflanzlichen Zellen die im Rahmen der vorliegenden Erfindung 

25 einer Transformation unterworfen werden kann und von der nach dem 
erf indungsgemafcen Verfahren trans formierte transgene pflanzliche 
Zellen erhalten und isoliert werden konnen. Besagte Population 
kann dabei beispielsweise auch ein pflanzlicbes Gewebe, Organ 
oder eine Zellkultur usw. sein. Beispielhaft jedoch nicht ein- 

30 schrankend, kann besagte Population eine isoliert e Zygote, ein 

isolierter unreifer Embryo, embryogener Kallus, Pflanzlichen oder 
auch verschiedene Blutengewebe (sowohl in vitro als auch in vivo) 
umf assen. 

35 "Genom" meint die Gesamtheit der Erbinf ormation einer pflanz- 
lichen Zelle und umfasst sowohl die genetische Inf ormation des 
Zellkerns als auch die der Plastiden (z.B. Chloroplasten) und 
Mitochondrien. Bevorzugt meint Genom jedoch die genetische 
Information des Zellkerns (beispielsweise der nuklearen Chromo- 

40 somen) - 

"Selektion" meint das Identif izieren und/oder Isolieren von 
erfolgreich trans formier en pflanzlichen Zellen aus einer Popu- 
lation nicht-transformierter Zellen unter Einsatz des erfindungs- 
45 gemaSen Verf ahrens . Dabei ist es nicht zwingend erf orderlich, 
dass die Selektion unmittelbar nach der Transformation direkt 
mit den trans formierten Zellen erfolgt. Es ist auch moglich, die 
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Selektion erst zu einem spateren Zeitpunkt, ja sogar bei einer 
spateren Generation der aus der Transformation resultierenden 
pflanzlichen Organismen (bzw. von diesen abgeleiteten Zellen, 
Geweben, Organen oder Vermehrungsgut ) vorzunehmen . So konnen 
5 beispielsweise Arabidopsispf lanzen direkt mit z.B. der Vakuum- 
infiltrationsmethode trans formiert werden (Clough S & Bent A 
(1998) Plant J 16 (6) :735-43; Bechtold N et al . (1993) CR Acad 
Sci Paris 1144 (2) : 204-212) und ergeben infolge transgene Samen, 
welche anschlieSend der Selektion ausgesetzt werden konnen. 

10 

Die Tatsache, dass die zu insertierende Nukleinsauresequenz u in 
Kombination mit" der "anti-Markerprotein"-Verbindung (beispiels- 
weise einem DNA-Konstrukt ) transf ormiert wird, ist breit zu ver- 
stehen und meint, dass mindestens eine zu insertierende Nuklein- 
15 sauresequenz und mindestens eine w anti-Markerprotein"-Verbindung 
miteinander funktionell gekoppelt sind, so dass das Vorliegen der 
"anti-Markerprotein"-Verbindung in der pflanzlichen Zelle - und 
des damit verbundenen Selektionsvorteils - das parallele Vor- 
liegen der insertierten Nukleinsauresequenz als wahrscheinlich 
20 anzeigt. Die zu insertierende Nukleinsauresequenz und die "anti- 
Markerprotein''-Verbindung (z.B. ein DNA-Konstrukt) konnen dabei 
bevorzugt, jedoch nicht zwingend, Teil eines einzigen Nuklein- 
saurekonstruktes (z.B. eines Transf ormationskonstruktes oder 
Trans f ormationsvektors) sein, also physikalisch-chemisch durch 
25 eine kovalente Bindung gekoppelt vorliegen. Sie konnen jedoch 
auch getrennt, beispielsweise im Rahmen einer Co-Transformation, 
gemeinsam eingeftihrt werden und auch so ihre Funktion im Rahmen 
des erf indungsgemaSen Verfahrens wahrnehmen. Im Falle, dass die 
"anti-Markerproteinverbindung" tiber die Expression einer RNA 
30 (beispielsweise eine antisense-RNA oder doppelstrangige RNA) 

wirkt oder eine solche RNA darstellt, kann w in Kombination" auch 
solche Ausfuhrunsformen umfassen, bei der die besagte RNA und die 
von der in das Genom insertierten Nukleinsauresequenz exprimierte 
RNA einen RNA-Strang ausbilden. 
35 "Nicht toxische Substanz X" meint allgemein Substanzen, die im 
Vergleich zu ihrem Umsetzungsprodukt Y - unter ansonsten gleichen 
Bedingungen - eine verminderte, bevorzugt eine im wesentlichen 
fehlende biologische Aktivitat - bevorzugt Toxizitat - aufweisen. 
Dabei ist die Toxizitat der Substanz Y mindestens doppelt so hoch 
40 wie die der Substanz X, bevorzugt mindestens funffach so hoch, 
besonders bevorzugt mindestens zehnfach so hoch, ganz besonders 
bevorzugt mindestens zwanzigfach so hoch, am meistens bevorzugt 
mindestens einhundertf ach so hoch. "Gleiche Bedingungen" meint 
dabei, dass alle Bedingungen abgesehen von den unterschiedlichen 
45 Substanzen X bzw. Y gleich gehalten werden. Es werden demnach 

gleiche molar e Konzentrationen von X bzw. Y, bei gleichem Medium, 
Temperatur, Organismenart und -dichte etc. eingesetzt. Die 
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Umwandlungen der Substanz X in die Substanz Y kann auf ver- 
schiedene Weise z.B. durch Hydrolyse, Deaminierung, Verseifung, 
Dephosphorylierung, Phosphorylierung, Oxidation oder eine andere 
Art der Aktivierung, Metabolisierung oder Umsetzung realisiert 
5 werden. Beispielhaft - jedoch nicht einschrankend - kann die 
Substanz X die inaktive Vorstufe oder Derivat eines Pflanzen- 
wachstumsregulators oder Herbizids sein. 

"Toxizitat" oder u toxischer Effekt" meint einen messbaren, 
10 negativen Einf luss auf die Physiologie der Pflanze oder der 
pflanzlichen Zelle und kann dabei Symptome wie beispielsweise 
- jedoch nicht einschrankend - ein vermindertes oder gestortes 
Wachstum, eine verminderte oder gestorte Photosyntheserate, eine 
verminderte oder gestorte Zellteilung, eine verminderte oder 
15 gestorte Regeneration einer vollstandigen Pflanze aus Zellkultur 
oder Kallus usw. umfassen. 

Die mittels des erf indungsgemassen Verfahrens erfolgreich trans- 
formierten pflanzlichen Zellen weisen - anders ausgedruckt - 

20 gegenuber den nicht-transf ormierten Zellen der gleichen Ausgangs- 
population einen Wachstumsvorteil oder Selektionsvorteil unter 
Einwirkung der Substanz "X" auf. Wachstums- oder Selektionsvor- 
teil ist dabei breit zu verstehen und meint beispielsweise die 
Tatsache, dass besagte trans formierte pflanzliche Zellen in der 

25 Lage sind, Schosslinge auszubilden und/oder zu vollstandigen 

Pflanzen regenerierbar sind, wohingegen die nicht-transf ormierten 
Zellen dies nicht oder nur mit deutlicher Verzogerung realisieren 
konnen . 

30 Der Begriff des "Markerproteins" ist breit zu verstehen und meint 
allgemein all solche Proteine, die befahigt sind, 

i) per se einen toxischen Effekt auf die Pflanze oder pflanz- 
liche Zelle auszuuben, oder 

35 

ii) eine nicht toxische Substanz X in eine fur die Pflanze oder 
pflanzliche Zelle toxische Substanz Y direkt oder indirekt 
umzusetzen. 

40 Dabei kann es sich bei dem Markerprotein urn ein pflanzeneigenes, 
endogenes Gen oder aber auch urn ein Transgen aus einem anderen 
Organismus handeln. Bevorzugt hat das Markerprotein selber keine 
essentielle Funktion fur den das Markerprotein umfassenden 
Organismus. Ubt das Markerprotein per se einen toxischen Effekt 

45 aus, so wird es bevorzugt nicht konstitutiv sondern beispiels- 
weise unter einem induzierbaren Promotor exprimiert . 
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Bevorzugt setzt jedoch das Markerprotein eine nicht toxische 
Substanz X in eine fur die Pflanze oder pflanzliche Zelle 
toxische Substanz Y direkt oder indirekt um. Insbesondere 
bevorzugt sind als Markerprotein die sogenannten "negativen 
Selektionsmarker" , wie sie beispielsweise im Rahmen von gezielten 
Deletionen aus dem Genom eingesetzt werden. 

Beispielhaft jedoch nicht einschrankend sind fur Markerproteine 
zu nennen: 

(a) Cytosindeaminasen (CodA oder CDase) , wobei bevorzugt 

Substanzen wie 5-Fluorocytosin (5-FC) als nicht toxische 
Substanz X eingesetzt werden. Cytosindeaminasen katalysieren 
die Deaminierung von Cytosin zu Uracil (Kilstrup M et al . 
(1989) J Bacterid 171:2124-2127; Anderson L et al . (1989) 
Arch Microbiol 152:115-118). Bakterien und Pilze, die CDase- 
Aktivitat aufweisen, konvertieren 5-FC zu dem toxischen Meta- 
boliten ( "Y" ) 5-Fluorouracil (5-FU) (Polak A & Scholer HJ 
(1975) Chemotherapy (Basel) 21:113-130). 5-FC selbst ist von 
geringer Toxizitat (Bennett JE, in Goodman and Gilman: the 
Pharmacological Basis of Therapeutics. 8th ed. , eds. Gilman 
AG et al. (Pergamon Press, New York) pp. 1165-1181). 5-FU 
jedoch hat einen stark zytotoxischen Effekt da es infolge zu 
Fluoro-UTP (FUTP) und Fluoro-dUMP (FdUMP) metabolisiert wird 
und so die RNA- und DNA-Syn these inhibiert (Calabrisi P & 
Chabner BA in Goodman and Gilman: the Pharmacological Basis 
of Therapeutics. 8th ed. , eds. Gilman AG et al . (Pergamon 
Press, New York) pp. 1209-1263); Damon LE et al . (1989) 
Pharmac Ther 43:155-189). 

Zellen hoherer Pflanzen und Saugerzellen haben keine signi- 
f ikante CDase-Aktivitat und konnen 5-FC nicht deaminieren 
(Polak A et al. (1976) Chemotherapy 22:137-153; Koechlin BA 
et al. (1966) Biochemical Pharmacology 15:434-446). Insofern 
wird im Rahmen des erf indungsgemafcen Verfahrens die CDase als 
Transgen (z.B. in Form einer transgenen Expressionskassette) 
in pflanzliche Organismen eingebracht. Entsprechende trans- 
gene pflanzliche Zellen oder Organismen werden dann als 
Masterpf lanzen als Ausgangsmaterial eingesetzt. Entsprechende 
CDase Sequenzen, transgene pflanzliche Organismen und die 
Durchfuhrung negativer Selektionsverf ahren unter Einsatz 
von z.B. 5-FC als nicht toxische Substanz X sind dem Fach- 
mann bekannt (WO 93/01281; US 5,358,866; Gleave AP et al . 
(1999) Plant Mol Biol 40 (2) :223-35; Perera RJ et al . (1993) 
Plant Mol Biol 23 (4 ): 793-799 ; Stougaard J (1993) Plant J 
3:755-761); EP-Al 595 837; Mullen CA et al . (1992) Proc Natl 
Acad Sci USA 89(l):33-37; Kobayashi T et al . (1995) Jpn J 
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Genet 70 (3 ): 409-422 ; Schlaman HRM & Hooykaas PFF (1997) Plant 
J 11:1377-1385; Xiaohui Wang H et al . (2001) Gene 272(1-2): 
249-255; Koprek T et al. (1999) Plant J 19 (6) : 719-726; Gleave 
AP et al. (1999) Plant Mol Biol 40 (2 ): 223-235 ; Gallego ME 
(1999) Plant Mol Biol 39(l):83-93; Salomon S & Puchta H 
(1998) EMBO J 17(20) :6086-6095; Thykjaer T et al . (1997) 
Plant Mol Biol 35 (4) : 523-530; Serino G (1997) Plant J 
12(3) :697-701; Risseeuw E (1997) Plant J 11 (4) : 717-728 ; Blanc 
V et al. (1996) Biochimie 78 ( 6 ): 511-517 ; Corneille S et al. 
(2001) Plant J 27:171-178). Cytosindeaminasen unci die dafur 
kodierenden Gene konnen aus einer Vielzahl von Organismen, 
bevorzugt Mikroorganismen, wie beispielsweise den Pilzen 
Cryptococcus neoformans, Candida albicans, Torulopsis 
glabrata, Sporothrix schenckii, Aspergillus, Cladosporium 
und Phialophora (JE Bennett, Chapter 50: Antifungal Agents, 
in Goodman and Gilman's the Pharmacological Basis of Thera- 
peutics 8th ed., A.G. Gilman, ed., Pergamon Press, New York, 
199 0) sowie den bakterien E.coli und Salmonella typhimuriuin 
(Andersen L et al. (1989) Arch Microbiol 152:115-118) 
erhalten werden. 

Auf die im Rahmen der genannten Publikationen of fenbarten 
Sequenzen, Materialien und Verfahren wird hiermit aus- 
drucklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: S56903, sowie die in EP-Al 595 873 
beschriebenen modif izierten codA Sequenzen, die eine 
Expression in Eukaryoten ermoglichen. Bevorzugt sind dabei 
Nukleinsauresequenzen, die fur Polypeptide gemafi SEQ ID NO: 2 
oder - bevorzugt - 4 kodieren, insbesondere die Sequenzen 
gemaS SEQ ID NO: 1 oder - bevorzugt - 3. 

(b) Cytochrom P-450 Enzyme, insbesondere das bakterielle Cyto- 
chrom P-450 SUl Genprodukt (CYP105A1) aus Streptomyces 
griseolus (Stamm ATCC 11796), wobei bevorzugt Substanzen wie 
das Pro-Sulfonylharnstoffherbizid R7402 (2-Methylethyl-2-3- 
dihydro-N- [ (4, 6-dimethoxypyrimidin-2-yl) aminocarbonyl] -1, 2- 
benzoisothiazol-7-sulf onamid-1, 1-dioxid) als nicht toxische 
Substanz X eingesetzt werden. Entsprechende Sequenzen und die 
Durchfiihrung negativer Selektionsverf ahren unter Einsatz von 
z.B. R7402 als nicht toxische Substanz X sind dem Fachmann 
bekannt (O'Keefe DP et al . (1994) Plant Physiol 105:473-482; 
Tissier AF et al. (1999) Plant Cell 11:1841-1852; Koprek T 
et al. (1999) Plant J 19 (6) :719-726; O'Keefe DP (1991) Bio- 
chemistry 30(2) :447-55) . Auf die im Rahmen der genannten 



WO 2004/013333 




PCT/EP2003/007877 



Publikationen offenbarten Sequenzen, Materialien unci Ver- 
fahren wird hiermit ausdriicklich Bezug genommen . 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
5 GenBank Acc.-No: M32238. Bevorzugt sind ferner Nuklein- 

sauresequenzen, die fur das Polypeptid gemaS SEQ ID NO: 6 
kodieren, insbesondere die Sequenz gemafe SEQ ID NO: 5. 



(c) Indolessigsaurehydrolasen wie beispielsweise das tms2 

10 Genprodukt aus Agrobacterium tumef aciens, wobei bevorzugt 

Substanzen wie Auxinamidverbindungen oder Naphthalacetamid 
(NAM) als nicht toxische Substanz X eingesetzt werden (wobei 
NAM zu Naphthalessigsaure, einer phytotoxischen Substanz, um- 
gesetzt wird) . Entsprechende Sequenzen und die Durchfuhrung 

15 negativer Selektionsverf ahren unter Einsatz von z.B. NAM als 

nicht toxische Substanz X sind dem Fachmann bekannt (Fedoroff 
NV & Smith DL (1993) Plant J 3:273-289; Upadhyaya NM et al . 
(2000) Plant Mol Biol Rep 18:227-223; Depicker AG et al . 
(1988) Plant Cell rep 104:1067-1071; Karlin-Neumannn GA 

20 et al. (1991) Plant Cell 3:573-582; Sundaresan V etal. (1995) 

Gene Develop 9:1797-1810; Cecchini E et al . (1998) Mutat 
Res 401(1-2) :199-206; Zubko E et al . (2000) Nat Biotechnol 
18:442-445). Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien und Verfahren wird hiermit 

25 ausdriicklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc-No: NC_003308 ( Protein_id="NP_536128 . 1) , AE009419, 
AB016260 (Protein_id="BAA87807.1) und NC002147. Bevorzugt 
30 sind ferner Nukleinsauresequenzen, die fur Polypeptide gemaS 

SEQ ID NO: .8 oder 10 kodieren, insbesondere die Sequenzen 
gemaS SEQ ID NO: 7 oder 9. 

(d) Haloalkandehalogenasen (dhl A Genprodukt) z.B. aus Xantho- 
35 bacter autotropicus GJ10. Die Dehalogenase hydrolisiert 

Dihaloalkane wie 1, 2-Dichloroethan (DCE) zu halogenierten 
Alkoholen und anorganischen Haliden (Naested H et al . (1999) 
Plant J 18(5)571-576; Janssen DB et al . (1994) Annu Rev 
Microbiol 48: 163-191; Janssen DB (1989) J Bacterid 
40 171 (12) : 6791-9) . Auf die im Rahmen der genannten Publi- 

kationen offenbarten Sequenzen, Materialien und Verfahren 
wird hiermit ausdriicklich Bezug genommen. 
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Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M26950. Bevorzugt sind ferner Nuklein- 
saiuresequenzen, die ftir das Polypeptid gemaS SEQ ID NO: 12 
kodieren, insbesondere die Sequenz gemafc SEQ ID NO: 11. 

5 

(e) Thymidinkinasen (TK) , insbesondere virale TKs aus Viren wie 

Herpes Simplex Virus, SV40, Cytomegalovirus, Varicella-zoster 
Virus, insbesondere die TK des Typ 1 Herpes Simplex Virus (TK 
HSV-1), wobei bevorzugt Substanzen wie Acyclovir, Ganciclovir 

10 oder 1 , 2-Deoxy-2-f luoro-p-D-arabinofuranosil-5-iodouracil 

(FIAU) als nicht toxische Substanz X eingesetzt werden. 
Entsprechende Sequenzen und die Durchfuhrung negativer 
Selektionsverfahren unter Einsatz von z.B. Acyclovir, 
Ganciclovir oder FIAU als nicht toxische Substanz X sind dem 

15 Fachmann bekannt (Czako M & Marton L (1994) Plant Physiol 

104:1067-1071; Wigler M et al . (1977) Cell 11 (1) : 223-232 
McKnight SL et al. (1980) Nucl Acids Res 8 (24) : 5949-5964; 
McKnight SL et al. (1980) Nucl Acids Res 8 (24) : 5931-5948 
Preston et al. (1981) J Virol 38 (2) : 593-605 ; Wagner et al . 

20 (1981) Proc Natl Acad Sci USA 78 (3 ): 1441-1445 ; St. Clair 

et al.(1987) Antimicrob Agents Chemother 31 ( 6 ): 844-849 ) . 
Auf die im Rahmen der genannten Publikationen of fenbarten 
Sequenzen, Mater ialien und Verfahren wird hiermit aus- 
drucklich Bezug genommen. 

25 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
GenBank Acc.-No: J02224, V00470 und V00467 . Bevorzugt sind 
ferner Nukleinsaureseguenzen, die fur Polypeptide gemafc 
SEQ ID NO: 14 oder 16 kodieren, insbesondere die Sequenzen 
30 gemaS SEQ ID NO: 13 oder 15. 

( f ) Guaninphosphor ibosyl trans f erasen, Hypoxanthinphosphor ibosyl - 
transferasen oder Xanthinguaninphosphor ibosyl transf erasen, 
wobei bevorzugt Substanzen wie 6-Thioxanthin oder Allopurinol 

35 als nicht toxische Substanz X eingesetzt werden. Bevorzugt 

sind Guaninphosphor ibosyl transf erasen (gpt) z.B. aus E. Coli 
(Besnard et al . (1987) Mol Cell Biol 7:4139; Mzoz and Moolten 
(1993) Human Gene Therapy 4:589-595; Ono et al . (1997) Hum 
Gene Ther 8 (17) : 2043-55 ) , Hypoxanthinphosphoribosyltrans- 

40 f erasen (HPRT; Jolly et al . (1983) Proc Natl Acad Sci USA 

80:477; Fonwick n The HGPRT System", pp. 333-373, M. Gottes- 
man (ed. ) , Molecular Cell Genetics, John Wiley and Sons, 
New York, 1985), Xanthinguaninphosphoribosyl transf erasen 
z.B. aus Toxoplasma gondii (Knoll LJ et al.(1998) Mol Cell 

45 Biol 18(2) :807-814; Donald RG et al. (1996) J Biol Chem 

271 (24) :14010-14019) . Auf die im Rahmen der genannten 
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Publikationen offenbarten Sequenzen, Materialmen und Ver- 
fahren wird hiermit ausdracklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
5 GenBank Acc.-No: U10247 (Toxoplasma gondii HXGPRT) , M13422 

(E. coli gpt) und X00221 (E. coli gpt) . Bevorzugt sind 
ferner Nukleinsauresequenzen, die fur Polypeptide gemafi 
SEQ ID NO: 18, 20 oder 22 kodieren, insbesondere die 
Sequenzen gemaS SEQ ID NO: 17, 19 oder 21. 

10 

(g) Purinnukleosidphosphorylasen (PNP; DeoD Genprodukt) z.B. 

aus E. coli, wobei bevorzugt Substanzen wie 6-Methylpurin- 
deoxyribonukleosid als nicht toxische Substanz X eingesetzt 
werden. Entsprechende Sequenzen und die Durchfuhrung nega- 

15 tiver Selektionsverf ahren unter Einsatz von z.B. 6-Methyl- 

purindeoxyribonukleosid als nicht toxische Substanz X sind 
dem Fachmann bekannt (Sorscher EJ et al . (1994) Gene Therapy 
1:233-238) . Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien und Verf ahren wird hiermit 

20 ausdrticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M60917. Bevorzugt sind ferner Nuklein- 
sauresequenzen, die fur das Polypeptid gemaS SEQ ID NO: 24 
25 kodieren, insbesondere die Sequenz gemafc SEQ ID NO: 23. 

h) phosphonatmonoesterhydrolasen, welche inaktive Esterderivate 
des Herbizides Glyphosat (z.B. Glycerylglyphosat ) zu der 
aktiven Form des Herbizids umsetzen. Entsprechende Sequenzen 
und die Durchfuhrung negativer Selektionsverf ahren unter Ein- 
satz von z.B. Glycerylglyphosat sind dem Fachmann bekannt 
(US 5,254,801; Dotson SB et al . (1996) Plant J 10 ( 2 ): 383-392 ; 
Dotson SB et al . (1996) J Biol Chem 271(42): 25754-25761). 
Auf die im Rahmen der genannten Publikationen offenbarten 
Sequenzen, Materialien und Verf ahren wird hiermit ausdrtick- 
lich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: U44852. Bevorzugt sind ferner Nuklein- 
sauresequenzen, die fur das Polypeptid gemafc SEQ ID NO: 26 
kodieren, insbesondere die Sequenz gemafc SEQ ID NO: 25. 



30 



35 



40 



(i) Aux-1 land - bevorzugt - Aux-2 Genprodukte z.B. der Ti- 

Plasmide von Agrobacterium Stammen wie A.rhizogenes oder 
A.tumefaciens (Beclin C et al. (1993) Transgenics Res 
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2:4855); Gaudin V, Jouanin L. (1995) Plant Mol Biol. 
28(1) : 123-36. 

Die Aktivitat der beiden Enzyme bedingt die Produktion von 
5 Indolacetamid (IAA) in der pflanzlichen Zelle. Aux-1 kodiert 

fur eine Indolacetamidsynthase (IAMS) und setzt Tryptophan zu 
Indolacetamid urn (VanOnckelen et al. (1986) FEBS Lett. 198: 
357-360) . Aux-2 kodiert fiir das Enzym Indolacetamidhydrolase 
(IAMH) und setzt Indolacetamid, eine Substanz ohne Phyto- 

10 hormonaktivitat , zu dem aktiven Auxin Indolessigsaure um 

(Inze D et al. (1984) Mol Gen Genet 194:265-274; Tomashow 
et al. (1984) Proc Natl Acad Sci USA 81:5071-5075; Schroder 
et al. (1984) Eur J Biochem 138:387-391). Das Enzym IAMH kann 
ferner einer Reihe von Indolamid-Substraten wie beispiels- 

15 weise Naphthalacetamid hydrolisieren, wobei letzteres in den 

Pf lanzenwachstumsregulator Naphthalessigsaure (NAA) umgesetzt 
wird. Die Verwendung des IAMH Gens als negativer Selektions- 
marker ist beispielsweise in US 5,180,873 beschrieben. 
Entsprechende Enzyme sind auch in A. rhizogenes, A. vitis 

20 (Canaday J et al. (1992) Mol Gen Genet 235:292-303) and 

Pseudomonas savastanoi (Yamada et al. (1985) Proc Natl 
Acad Sci USA 82:6522-6526) beschrieben. Der Einsatz als 
negativer Selektionsmarker zum Abtoten bestimmter Zell- 
gewebe (z.B. Pollen; US 5,426,041) oder transgener Pflanzen 

25 (US 5,180,873) ist beschrieben. Entsprechende Sequenzen und 

die Durchfuhrung negativer Selektionsverf ahren unter Einsatz 
von z.B. Naphthalacetamid sind dem Fachmann bekannt (s.o.). 
Auf die im Rahmen der genannten Publikationen of fenbarten 
Sequenzen, Materialien und Verfahren wird hiermit aus- 

30 drucklich Bezug genommen. 



Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc.-No: M61151, AF039169 und AB025110. Bevorzugt sind 
ferner Nukleinsauresequenzen, die fur Polypeptide gemaS 
35 SEQ ID NO: 28, 30, 32, 34 oder 36 kodieren, insbesondere 

die Sequenzen gemafc SEQ ID NO: 27, 29, 31, 33 oder 35. 



(j) Adeninphosphoribosyltransferasen (APRT) , wobei bevorzugt 
Substanzen wie 4-Aminopyrazolopyrimidin als nicht toxische 

40 Substanz X eingesetzt werden. Entsprechende Sequenzen und die 

Durchfuhrung negativer Selektionsverf ahren unter Einsatz sind 
dem Fachmann bekannt (Wigler M et al . (1979) Proc Natl Acad 
Sci USA 76(3) :1373-6; Taylor et al. "The APRT System'', pp., 
311-332, M. Gottesman (ed.), Molecular Cell Genetics, John 

45 Wiley and Sons, New York, 1985). 
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k) Methoxinindehydrogenasen, wobei bevorzugt Substanzen wie 

2-Amino-4-methoxy-butansaure (Methoxinin) als nicht toxische 
Substanz X eingesetzt werden, welches zum toxischen Methoxy- 
vinylglycin umgesetzt wird (Margraff R et al. (1980) Experi- 
mentia 36 : 846) . 

1) Rhizobitoxinsynthasen, wobei bevorzugt Substanzen wie 

2-Amino-4-methoxy-butansaure (Methoxinin) als nicht toxische 
Substanz X eingesetzt werden, welches zum toxischen 2 -Amino - 
4- [2-amino-3-hydroxypropyl] -trans-3-butansaure (Rhizobi toxin) 
umgesetzt wird (Owens LD et al . (1973) Weed Science 
21:63-66) , 

m) 5-Methylthioribose (MTR) kinasen, wobei bevorzugt Substanzen 
wie 5- (Trifluoromethyl) thioribose (MTR-Analog, "subversives 
Substrat") als nicht toxische Substanz X eingesetzt wird, 
welches uber ein instabiles Intermediat zu der toxischen 
Substanz (Y) Carbothionyldif luorid umgesetzt wird. Die 
MTR-Kinase ist ein Schlusselenzym des Methionin-Ausweich- 
Stof fwechselwegs ("Salvage Pathway"). Entsprechende Enzym- 
aktivitaten wurden nicht in Saugern, wohl aber in Pflanzen, 
Bakterien und Protozoen beschrieben. MTR Kinasen aus ver- 
schiedenen Art en wurden aufgrund definierter Sequenzmotive 
identifiziert (Sekowska A et al . (2001) BMC Microbiol 1:15; 
http://www.biomedcentral.eom/1471-2180/l/15) . Entsprechende 
Sequenzen und die Durchfuhrung negativer Selektionsverf ahren 
unter Einsatz von z.B. 5- (Trifluoromethyl) thioribose sind dem 
Fachmann bekannt und leicht aus entsprechenden Sequenzdaten- 
bank (z.B. GenBank) erhaltlich (Sekowska A et al. (2001) 
BMC Microbiol 1:15; Cornell KA et al . (1996) 317:285-290). 
Auf die im Rahmen der genannten Publikationen offenbarten 
Sequenzen, Materialien und Verf ahren wird hiermit ausdruck- 
lich Bezug genommen. 

Eine pflanzliche MTR-Kinase ist bislang jedoch nicht 

eindeutig identifiziert worden und wird im Rahmen des 

erf indungsgemafcen Verfahrens bereitsgestellt (SEQ ID NO: 39 

bzw. 40) . Daruberhinaus werden Homologe aus anderen Pflanzen- 

arten bereitgestellt namlich aus Mais (SEQ ID NO: 59 bzw. 

60), Raps (SEQ ID NO: 61, 63 bzw. 62, 64), Reis (SEQ ID 

NO: 65 bzw. 66) sowie Soja (SEQ ID NO: 67 bzw. 68). 

Ein weiterer Gegenstand der Erfindung betrifft demnach Amino- 
sauresequenzen kodieren fur eine pflanzliche 5-Methylthio- 
ribosekinase, dadurch gekennzeichnet , dass besagte Amino- 
sauresequenz mindestens eine Sequenz enthalt ausgewahlt aus 
der Gruppe bestehend aus SEQ ID NO: 60, 62, 64, 66 oder 68. 
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Ein weiterer Gegenstand der Erfindung betrif ft demnach 
Nukleinsauresequenzen kodieren fur eine pflanzliche 5-Methyl- 
thioribosekinase, dadurch gekennzeichnet , dass besagte 
Nukleinsauresequenz mindestens eine Sequenz enthalt ausge- 
wahlt aus der Gruppe bestehend aus SEQ ID NO: 59, 61, 63, 65 
Oder 67. Auch wenn besagte Sequenzen teilweise nur Fragmente 
vollstandiger cDNAs darstellen, ist ihre Lange dennoch mehr 
als ausreichend um eine Verwendung und Funktionalitat als 
ants ens e-RNA bzw. doppelstrangige RNA zu gewahrleisten. Be- 
vorzugt wird als Markerprotein eine pflanzliche, endogene 
MTR-Kinase verwendet . Weitere endogene pflanzliche MTR- 
Kinasen konnen leicht mittels Durchmusterung von Daten- 
oder Genbanken unter Verwendung konservierter , MTK-Kinase 
typischer Motive identif iziert werden. Besagte Motive konnen 
beispielsweise aus Fig. 9a-b abgeleitet werden. Solche Motive 
konnen beispielhaft jedoch nicht einschrankend folgende 
Sequenzen urafassen: 

E(V/I)GDGN(L/I)N(L/Y/F)V(F/Y) bevorzugt EVGDGNLN (Y/F) V (F/Y) 

KQALPY(V/I)RC 

SWPMT (R/K) ERAYF 

PEVYHFDRT 

GMRY (I/Ii) EPPHI 

CRIiTEQWFSDPY 

HGDLH ( S/T) GS 

Weitere geeignete Motive konnen unschwer aus FIg.9a-b abge- 
leitet werden. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc.-No: AF212863 oder AC079674 ( Protein_ID=AAG51775 . 1 ) . 
Bevorzugt sind ferner Nukleinsauresequenzen, die fur Poly- 
peptide gemaS SEQ ID NO: 38 oder 40 kodieren, insbesondere 
die Sequenzen gemafc SEQ ID NO: 37 oder 39. 

n) Alkoholdehydrogenasen (Adh) insbesondere pflanzliche Adh-1 
genprodukte, wobei bevorzugt Substanzen wie Allylalkohol 
als nicht toxische Substanz X eingesetzt werden, welche 
so zu der toxischen Substanz (Y) Acrolein umgesetzt wird. 
Entsprechende Sequenzen und die Durchfuhrung negativer 
Selektionsverf ahren unter Einsatz von z.B. Allylalkohol sind 
dem Fachmann bekannt und leicht aus entsprechenden Sequenz - 
datenbank (z.B. GenBank) erhaltlich (Wisman E et al . (1991) 
Mol Gen Genet 226 (1-2 ): 120-8 ; Jacobs M et al . (1988) Biochem 
Genet 26 (1-2) : 105-22 ; Schwartz D. (1981) Environ Health 
Perspect 37:75-7). Auf die im Rahmen der genannten Publi- 
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kationen offenbarten Sequenzen, Materialien und Verfahren 
wird hiermit ausdrticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
5 Bank Acc.-No: X77943, M12196, AF172282, X04049 oder AF253472. 

Bevorzugt sind ferner Nukleinsauresequenzen, die fur Poly- 
peptide gemaS SEQ ID NO: 42, 44, 46 oder 48 kodieren, ins- 
besondere die Sequenzen gemaS SEQ ID NO: 41, 43, 45 oder 47. 

10 (o) Weiterhin sind als negativer Selektionsmarker solche 

Sequenzen geeignet, die per se eine toxische Wirkung auf 
pflanzliche Zellen ausuben, wie beispielsweise Diptheriatoxin 
A, Ribonukleasen wie Barnase sowie Ribosom-inhibierende 
Proteine wie Ricin. Dabei werden diese Proteine bevorzugt in 

15 den pflanzlichen Zellen nicht konstitutiv, sondern induzier- 

bar exprimiert. Bevorzugt erfolgt die Induktion chemisch, 
wobei beispielsweise die unten erwahnten chemisch- induzier- 
baren Promotoren verwendet werden konnen, urn diese chemisch- 
induzierte Expression zu gewahrleisten. 

20 

"Verminderung" oder "vermindern" ist im Zusammenhang mit 
einem Markerprotein, bzw. seiner Menge, Expression, Aktivitat 
und/oder Funktion weit auszulegen und umfasst die teilweise 
oder im wesentlichen vollstandige, auf unterschiedliche zell- 
25 biologische Mechanismen beruhende Unterbindung oder Blockierung 
der Funktionalitat eines Markerproteins in einer pflanzlichen 
Zelle, Pflanze oder einem davon abgeleiteten Teil, Gewebe, Organ, 
Zellen oder Samen. 

30 Eine Verminderung im Sinne der Erfindung umfasst auch eine 

mengenma&ige Verringerung eines Markerproteins bis hin zu einem 
im wesentlichen vollstandigen Fehlen des Markerproteins (d.h. 
fehlende Nachweisbarkeit von Markerprotein-Aktivitat bzw. Marker- 
protein-Funktion oder fehlende imm\inologische Nachweisbarkeit 

35 des Markerproteins) . Dabei wird die Expression eines bestimmten 
Markerproteins (bzw. seiner Menge, Expression, Aktivitat und/oder 
Funktion) in einer Zelle oder einem Organismus bevorzugt um mehr 
als 50 %, besonders bevorzugt um mehr als 80 %, ganz besonders 
bevorzugt vim mehr als 90%, am meisten bevorzugt um mehr als 

40 98 % vermindert. Insbesondere meint Verminderung auch das 
vollstandigen Fehlen des Markerproteins (bzw. seiner Menge, 
Expression, Aktivitat und/oder Funktion) . Dabei meint Aktivitat 
und/oder Funktion bevorzugt die Eigenschaft des Markerproteins 
einen toxischen Effekt auf die pflanzliche Zelle oder den pflanz- 

45 lichen Organismus auszuuben bzw. die Fahigkeit die Substanz X 
in die Substanz Y umzusetzen. Bevorzugt wird als der durch 
das Markerprotein bewirkte toxische Effekt um mehr als 50 %, 
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22 

besonders bevorzugt um mehr als 80 %, ganz besonders bevorzugt 
um mehr als 90%, am meisten bevorzugt um mehr als 98 % ver- 
mindert. Selbst verstandliche umfasst "Verminderung" im Rahmen 
des erfindungsgemafcen Verfahrens auch eine vollstandige, 100%ige 
5 Verminderung oder Beseitigung des Markerproteins (bzw. seiner 
Menge, Expression, Aktivitat und/oder Funktion) (z.B. durch 
Deletion des Markerprotein-Gens aus dem Genom) . 

Erf indungsgemafc sind verschiedene Strategien zur Verminderung der 
10 Expression, Menge, Aktivitat und/oder Funktion des Markerproteins 
umfasst. Der Fachmann erkennt, dass eine Reihe verschiedener 
Methoden zur Verftigung stehen, um die Expression, Menge, Aktivi- 
tat und/oder Funktion eines Markerproteins in gewunschter Weise 
zu beeinflussen. Beispielhaf t , jedoch nicht einschrankend, seien 
15 zu nennen : 

a) Einbringen mindestens einer doppelstrangigen Markerprotein 
Ribonukleins&uresequenz (MP-dsRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette oder 

20 Expressionskassetten. Umfasst sind solche Verfahren, 

bei denen die MP— dsRNA gegen^ein Markerprotein-Gen (also 
genomische DNA-Sequenzen wie Promotorsequenzen) oder ein 
Markerprotein-Gentranskript (also mRNA-Sequenzen) gerichtet 
ist . 

25 

b) Einbringen mindestens einer Markerprotein antisense-Ribo- 
nukleinsauresequenz (MP-antisenseRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette. Umfasst 
sind solche Verfahren, bei denen die MP-antisenseRNA gegen 

30 ein Markerprotein-Gen (also genomische DNA-Sequenzen) 

oder ein Markerprotein-Gentranskript (also RNA-Sequenzen) 
gerichtet ist. Umfasst sind auch a-anomere Nukleinsaure- 
sequenzen. 

35 c) Einbringen mindestens einer MP-antisenseRNA kombiniert mit 
einem Ribozym oder einer deren Expression gewahrleistenden 
Expressionskassette 

d) Einbringen mindestens einer Markerprotein sense-Ribonuklein- 
40 sauresequenz (MP-senseRNA) zur Induktion einer Kosuppression 

oder einer deren Expression gewahrleistenden Expressions- 
kassette 



45 
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e) Einbringen mindestens eines DNA-oder Protein-bindenden 
Faktors gegen ein Markerprotein-Gen, —RNA oder -Protein 
oder einer dessen Expression gewahrleistenden Expressions- 
kassette 

5 

f ) Einbringen mindestens einer den Markerprotein RNA-Abbau 
bewirkenden viralen Nukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette 

10 g) Einbringen mindestens eines Konstruktes zur Erzeugung eines 
Funktionsverlustes (z.B. Generierung von Stopp-Kodons , Ver- 
schiebungen im Leseraster etc . ) an einem Markerprotein-Gen 
beispielsweise durch Erzeugung einer Insertion, Deletion, 
Inversion oder Mutation in einem Markerprotein-Gen. Bevorzugt 

15 konnen Knockout -Mutanten mittels gezielter Insertion in 

besagtes Markerprotein-Gen durch homologer Rekombination 
oder Einbringen von sequenzspezif ischen Nukleasen gegen 
Markerprotein-Gensequenzen generiert werden. 

20 Dem Fachmann ist bekannt, dass auch weitere Verfahren im Rahmen 
der vorliegenden Erfindung zur Verminderung eines Markerproteins 
bzw. seiner Aktivitat oder Funktion eingesetzt werden konnen. 
Beispielsweise kann auch - je nach Art des verwendeten Marker- 
proteins - das Einbringen einer dominant -negativen Variante eines 

25 Markerproteins oder einer deren Expression gewahrleistenden 

Expressionskassette vorteilhaft sein. Dabei kann jedes einzelne 
dieser Verfahren eine Verminderung der Expression, Menge, Aktivi- 
tat und/oder Funktion eines Markerproteins bewirken. Auch eine 
kombinierte Anwendung ist denkbar. Weitere Methoden sind dem 

30 Fachmann bekannt und kdnnen die Behinderung oder Unterbindung 
der Prozessierung des Markerproteins, des Transports des Marker- 
proteins oder dessen mRNA, Hemmung der Ribosomenanlagerung, 
Hemmung des RNA-Splei&ens , Induktion eines Markerprotein-RNA 
abbauenden Enzyms und/oder Hemmung der Translationselongation 

35 oder -termination umfassen. 

Die einzelnen bevorzugten Verfahren seien infolge durch beispiel- 
hafte Ausfiihrungsf ormen beschrieben: 

40 a) Einbringen einer doppelstrangigen Ribonukleinsauresequenz 
eines Markerproteins (MP— dsRNA) 

Das Verfahren der Genregulation mittels doppelstrangiger RNA 
("double-stranded RNA interference"; dsRNAi) ist vielfach 
45 fur tierische und pflanzliche Organismen beschrieben (z.B. 

Matzke MA et al • (2000) Plant Mol Biol 43:401-415; Fire A. et al 
(1998) Nature 391:806-811; WO 99/32619; WO 99/53050; WO 00/68374; 
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WO 00/44914; WO 00/44895; WO 00/49035; WO 00/63364) . Auf die 
in den angegebenen Zitaten beschriebenen Verfahren und Methoden 
wird hiermit ausdrucklich Bezug genommen. dsRNAi -Verfahren 
beruhen auf dem Phanomen, dass durch gleichzeitiges Einbringen 
5 von komplementaren Strang- und Gegenstrang eines Gentranskriptes 
eine hochef f iziente Unterdruckung der Expression des ent- 
sprechenden Gens bewirkt wird. Der bewirkte Phanotyp kommt 
dem einer entsprechenden knock-out Mutanten sehr ahnlich (Water- 
house PM et al. (1998) Proc Natl Acad Sci USA 95:13959-64). Das 
10 dsRNAi -Verfahren hat sich bei der Verminderung der Markerprotein- 
Expression als besonders effizient und vorteilhaft erwiesen. 

Doppelstrangiges RNA-Mo 1 eku 1 meint im Rahmen der Erfindung bevor- 
zugt eine oder mehr Ribonukleinsauresequenzen, die aufgrund 

15 komplementarer Sequenzen theoretisch (z.B. gemote den Basenpaar- 
regeln von Waston und Crick) und/oder faktisch (z.B. aufgrund 
von Hybridisierungsexperimenten in vitro und/oder in vivo) in 
der Lage sind, doppelstrangige RNA-Strukturen auszubilden. Dem 
Fachmann ist bewusst, dass die Ausbildung von doppelstrangigen 

20 RNA-Strukturen, einen Gleichgewichtszustand darstellt. Bevor- 
zugt ist das Verhaltnis von doppelstrangigen Molekulen zu ent- 
sprechenden dissozierten Formen mindestens 1 zu 10, bevorzugt 
1:1, besonders bevorzugt 5:1, am meisten bevorzugt 10:1. 

25 Ein weiterer Gegenstand der Erfindung bezieht sich daher 
auf doppelstrangige RNA-Molektile (dsRNA-Molekule) , die bei 
Einbringen in einen pflanzlichen Organismus (oder eine davon 
abgeleitete Zelle, Gewebe, Organ oder Vermehrungsmaterial) 
die Verminderung mindestens eines Markerproteins bewirken. 

30 Das doppelstrangige RNA-Molekul zur Verminderung der Expression 
eines Markerproteins (MP— dsRNA) umfasst dabei bevorzugt 

a) einen * sense" -RNA-Strang umfassend mindestens eine Ribo- 
nukleotidseqpaenz, die im wesentlichen identisch ist zu 

35 mindestens einem Teil des u sense" -RNA-Transkriptes einer 

Nukleinsauresequenz kodierend fur ein Markerprotein, und 

b) einen "antisense"-RNA-Strang, der zu dem RNA-" sense "-Strang 
unter a) im wesentlichen - bevorzugt vollstandig - komplemen- 

40 taren ist. 

In Bezug auf die dsRNA-Molekule meint Markerprotein-Nukleinsaure- 
sequenz bevorzugt eine Sequenz gemaS SEQ ID NO: 1, 3, 5, 7, 9, 
11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 
45 43, 45 oder 47 oder ein f unktionelles Aquivalent derselben. 
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25 

"Im wesentlichen identisch" meint, dass die dsRNA Sequenz auch 
Insertionen, Deletionen sowie einzelne Punktmutationen im Ver- 
gleich zu der Markerprotein Zielsequenz aufweisen kann und 
dennoch eine effizient Verminderung der Expression bewirkt. 
5 Bevorzugt betragt die Homologie (nach weiter unten folgender 
Definition) mindestens 75 %, bevorzugt mindestens 80 %, ganz 
besonders bevorzugt mindestens 90 % am meisten bevorzugt 100 % 
zwischen dem "sense' 7 -Strang einer inhibitor! schen dsRNA und 
mindestens einem Teil des W sense"-RNA-Transkriptes einer Nuklein- 
10 sauresequenz kodierend fur ein Markerprotein (bzw. zwischen dem 
"antisense" -Strang dem komplementaren Strang einer Nukleinsaure- 
sequenz kodierend fur ein Markerprotein) . 

Eine 100%ige Sequenzidentitat zwischen dsRNA und einem Marker- 
15 protein Gentranskript ist nicht zwingend erf orderlich, urn eine 
effiziente Verminderung der Markerprotein Expression zu bewirken. 
Demzufolge besteht der Vorteil, dass das Verfahren tolerant 
ist gegentiber Sequenz abweichungen, wie sie infolge genetischer 
Mutationen, Polymorphismen oder evolutionarer Divergenzen vor- 
20 liegen konnen. So ist es beispielsweise moglich mit der dsRNA, 
die ausgehend von der Markerprotein Sequenz des einen Organismus 
generiert wurde, die Markerprotein Expression in einem anderen 
Organismus zu unterdrucken. Dies ist besonders dann vorteilhaft, 
wenn als Markerprotein ein pf lanzeneigenes , endogenes Marker- 
25 protein verwendet wird (beispielsweise eine 5-Methylthioribose- 
kinase oder Alkoholdehydrogenase) . Zu diesem Zweck umfasst 
die dsRNA bevorzugt Sequenzbereiche von Markerprotein-Gen- 
transkripten, die konservierten Bereichen entsprechen. Besagte 
konservierte Bereiche konnen aus Sequenzvergleichen leicht 
abgeleitet werden. 
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Die Lange des Teilabschnittes betragt mindestens 10 Basen, 
bevorzugt mindestens 25 Basen, besonders bevorzugt mindestens 
50 Basen, ganz besonders bevorzugt mindestens 100 Basen, am 
meisten bevorzugt mindestens 200 Basen oder mindestens 300 Basen. 

Alternativ, kann eine "im wesentlichen identische" dsRNA auch als 
Nukleinsauresequenz definiert werden, die befahigt ist, mit einem 
Teil eines Markerprotein Gentranskriptes zu hybridisieren (z.B. 
in 400 mM NaCl, 40 mM PIPES pH 6,4, 1 mM EDTA bei 50°C oder 70°C 
fur 12 bis 16 h) . 

u Im wesentlichen komplementar" meint, dass der "antisense"- 
RISFA-Strang auch Insertionen, Deletionen sowie einzelne Punkt- 
mutationen im Vergleich zu dem Komplement des * sense "-RNA- 
Stranges aufweisen kann. Bevorzugt betragt die Homologie min- 
destens 80 %, bevorzugt mindestens 9 0 %, ganz besonders bevorzugt 
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mindestens 95 %, am meisten bevorzugt 100% zwischen dem "anti- 
sense "-RNA-St rang und dem Komplement des tt sense ff -RNA-Stranges - 

u Teil des 14 sense" -RNA-Transkriptes" einer Nukleinsauresequenz 
5 kodierend fttr ein Markerprotein meint Fragmente einer RNA oder 
mRNA transkribiert oder transkribierbar von einer fur ein Marker- 
protein kodierenden Nukleinsauresequenz , bevorzugt von einem 
Markerprotein-Gen. Dabei haben die Fragmente bevorzugt eine 
Sequenzlange von mindestens 20 Basen, bevorzugt mindestens 

10 50 Basen, besonders bevorzugt mindestens 100 Basen, ganz 

besonders bevorzugt mindestens 200 Basen, am meisten bevorzugt 
mindestens 500 Basen. Umfasst ist auch die vollstandige 
transkribierte RNA oder mRNA. Umfasst sind auch Sequenzen wie 
sie unter kunst lichen Bedingungen von Regionen eines Marker- 

15 protein-Gens transkribiert werden konnen, die ansonsten - unter 
naturlichen Bedingungen - nicht transkribiert werden, wie bei- 
spielsweise Promotorregionen. 

Die dsRNA kann aus einem oder mehr Strangen von Polyribonukleo- 
20 tiden bestehen. Naturlich konnen, urn den gleichen Zweck zu 

erreichen, auch mehrere individuelle dsRNA Molekule, die jeweils 
einen der oben def inierten Ribonukleotidsequenzabschnitte um- 
fassen, in die Zelle oder den Organismus eingebracht werden. Die 
doppelstrangige dsRNA-Struktur kann ausgehend von zwei komplemen- 
25 tar en, separaten RNA-Strangen oder - bevorzugt - ausgehend von 
einem einzelnen, selbstkomplementaren RNA-Strang gebildet werden. 
In diesem Fall sind xx sense "-RNA-Strang und "antisense" -RNA-Strang 
bevorzugt kovalent in Form eines invertierten " Repeats" mitein- 
ander verbunden. 

30 

Wie z.B. in WO 99/53050 beschrieben, kann die dsRNA auch eine 
Haarnadelstruktur umfassen, indem "sense"- und M antisense" -Strang 
durch eine verbindende Sequenz ("Linker"; beispielsweise ein 
Intron) verbunden werden. Die selbstkomplementaren dsRNA-Struk- 

35 turen sind bevorzugt, da sie lediglich die Expression einer RNA— 
Sequenz erfordern und die komplementaren RNA-Strange stets in 
einem aquimolaren Verhaltnis umfassen. Bevorzugt kann ist die 
verbindende Sequenz ein Intron (z.B. ein Intron des ST-LSl Gens 
aus Kartoffel; Vancanneyt GF et al . (1990) Mol Gen Genet 

40 220(2) :245-250) . 

Die Nukleinsauresequenz kodierend fur eine dsRNA kann weitere 
Elemente beinhalten, wie beispielsweise Transkriptionstermina- 
tionssignale oder Polyadenylierungssignale . 
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Sollen die zwei Strange der dsRNA in einer Zelle oder Pflanze 
zusammengebracht werden, so kann dies beispielhaft auf folgende 
Art geschehen: 

5 a) Transformation der Zelle oder Pflanze mit einem Vektor, der 
beide Expressionskassetten umfasst, 

b) Kotransformation der Zelle oder Pflanze mit zwei Vektoren, 
wobei der eine die Expressionskassetten mit dem u sense"- 
10 Strang, der andere die Expressionskassetten mit dem "anti- 

sense" -Strang umfasst. 

Die Bildung der RNA Duplex kann entweder au&erhalb der Zelle oder 
innerhalb derselben initiiert werden. 

15 

Die dsRNA kann entweder in vivo oder in vitro synthetisiert 
werden. Dazu kann eine DNA-Sequenz kodierend fur eine dsRNA 
in eine Expressionskassette unter Kontrolle mindestens eines 
genetischen Kontrollelementes (wie beispielsweise einem Promotor) 

20 gebracht werden. Eine Polyadenylierung ist nicht erf orderlich, 
ebenso miissen keine Elemente zur Initiierung einer Translation 
vorhanden sein. Bevorzugt ist die Expressionskassette fur die MP- 
dsRNA auf dem Trans format ionskonstrukt oder dem Transf ormations- 
vektor enthalten. Die Expressionskassetten kodierend fur den 

25 "antisense"- und/oder den "sense" -Strang einer MP-dsRNA oder fur 
den selbstkomplementaren-Strang der dsRNA, werden dazu bevorzugt 
in einen Transf ormat ions vekt or insertiert und mit den unten 
beschriebenen Verfahren in die pflanzliche Zelle eingebracht . Fur 
das Erf indungsgemaEe Verfahren kann eine stabile Insertion in das 
Genom vorteilhaft sein, ist aber nicht zwingend erf orderlich. Da 

30 eine dsRNA einen langanhaltenden Effekt bewirkt, ist in vielen 
Fallen auch eine transiente Expression ausreichend. Die dsRNA 
kann auch Teil der von der zu insertierenden Nukleinsauresequenz 
zu exprimierenden RNA sein, indem sie beispielsweise an den 
3'-untranslatierten Teil besagter RNA fusioniert wird. 



Die dsRNA kann in einer Menge eingeftihrt werden, die zumindest 
eine Kopie pro Zelle ermoglicht . Hohere Mengen (z.B. mindestens 
5, 10, 100, 500 oder 1000 Kopien pro Zelle) konnen ggf - eine 
effizienter Verminderung bewirken. 



b) Einbringen einer antisense-Ribonukleinsauresequenz eines 
Mar ker pr o t e ins ( MP-an t i s ens eRNA ) 

Verfahren zur Verminderung eines bestimmten Proteins durch die 
45 "antisense"-Technologie sind vielfach - auch in Pflanzen - 
beschrieben (Sheehy et al. (1988) Proc Natl Acad Sci USA 85: 
8805-8809; US 4,801,340; Mol JN et al . (1990) FEBS Lett 
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268(2) :427-430) . Das antisense Nukleinsauremolekiil hybridisiert 
bzw. bindet mit der zellularen mRNA und/oder genomischen DNA 
kodierend fur das zu vermindernde Markerprotein. Dadurch wird 
die Transkription und/oder Translation des Markerproteins unter- 
5 drtickt. Die Hybridisierung kann auf konventionelle Art uber die 
Bildung einer stabilen Duplex oder - im Fall von genomischer 
DNA - durch Bindung des antisense Nukleinsauremolekiil s mit der 
Duplex der genomischen DNA durch spezifische Wechselwirkung in 
der groSen Furche der DNA— Helix entstehen. 



Eine MP-antisenseRNA kann unter Verwendung der fttr dieses 
Markerprotein kodierenden Nukleinsauresequenz , beispielsweise 
der Nukleinsauresequenz gemafc SEQ ID NO: 1, 3, 5, 7 , 9, 11, 13, 
15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 
oder 47 nach den Basenpaarregeln von Watson und Crick abgeleitet 

15 

werden. Die MP-antisenseRNA kann zu der gesamten transkribxerten 
mRNA des Markerproteins komplementar sein, sich auf die kodie- 
rende Region beschranken oder nur aus einem Oligonukleotid be- 
stehen, das zu einem Teil der kodierenden oder nicht-kodierenden 
Seguenz der mRNA komplementar ist. So kann das Oligonukleotid 

20 

beispielsweise komplementar zu d^r Region sein, die den Trans- 
lationsstart fur das Markerprotein umfasst. Die MP-antisenseRNA 
kann eine Lange von zum Beispiel 5, 10, 15, 20, 25, 30, 35, 40, 
45 oder 50 Nukleotide haben, kann aber auch langer sein und min- 
destens 100, 200, 500, 1000, 2000 oder 5000 Nukleotide umfassen. 
25 Mp_ an tisenseRNA werden im Rahmen des erf indungsgemaSen Verfahrens 
bevorzugt rekombinant in der Zielzelle exprimiert . 

Die MP-antisenseRNA kann auch Teil einer von der zu insertieren- 
den Nukleinsauresequenz zu exprimierenden RNA sein, indent sie 
30 beispielsweise an den 3 ' -untranslatierten Teil besagter RNA 
f usioniert ist . 

Ein weiterer Gegenstand der Erfindung betrifft transgene 
Expressionskassetten enthaltend eine Nukleinsauresequenz 

35 kodierend fur zumindest einen Teil eines Markerproteins, wobei 
besagte Nukleinsauresequenz mit einem in pf lanzlichen Organismen 
funktionellen Promotor in antisense-Orientierung funktionell 
verknupft ist. Besagte Expressionskassetten konnen Teil eines 
Trans formationskonstruktes oder Transf ormationsvektors sein, oder 

40 aber auch im Rahmen einer Kotransf ormation eingefiihrt werden. 

In einer weiteren bevorzugten Aus fiihrungs form kann die Expression 
eines Markerproteins durch Nukleotidsequenzen inhibiert werden, 
die komplementar zu der regulatorischen Region eines Marker- 
45 protein-Gens (z.B. einem Markerprotein Promoter und/oder 

Enhancer) sind und triple-helikale Strukturen mit der dortigen 
DNA-Doppelhelix ausbilden, so dass die Transkription des Marker- 
protein-Gens vermindert wird. Entsprechende Verfahren sind 
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beschrieben (Helene C (1991) Anticancer Drug Res 6(6):569-84; 
Helene C et al. (1992) Ann NY Acad Sci 660:27-36; Maher LJ (1992) 
Bioassays 14(12) : 807-815) . 

In einer weiteren Ausf uhrungsf orm kann die MP-antisenseRNA eine 
a-anomere Nukleinsaure sein. Derartige a-anomere Nukleins&ure- 
molekttle bilden spezifische doppelstrangige Hybride mit komple- 
mentarer RNA in denen, - im Unterschied zu den konventionellen 
(5-Nukleinsauren - die beiden Strange parallel zueinander verlaufen 
(Gautier C et al. (1987) Nucleic Acids Res 15:6625-6641). 

c) Einbringen einer MP-antisenseRNA kombiniert mit einem Ribozym 



Vorteilhaft kann die oben beschriebene antisense-Strategie mit 
15 einem Ribozym-Verf ahren gekoppelt werden. Katalytische RNA— Mole - 
kiile Oder Ribozyme k6nnen an jede beliebige Ziel-RNA angepasst 
werden und spalten das Phosphodiester-Gertist an spezif ischen 
Positionen, wodurch die Ziel-RNA funktionell deaktiviert wird 
(Tanner NK (1999) FEMS Microbiol Rev 23 (3 ): 257-275 ) . Das Ribozym 
wird dadurch nicht selber modifiziert, sondern ist in der Lage, 
20 weitere Ziel-RNA-Molekule analog zu spalten, wodurch es die 
Eigenschaf ten eines Enzyms erhalt. Der Einbau von Ribozym- 
sequenzen in w antisense"-RNAs verleiht eben diesen "anti- 
sense" -RNAs diese enzymahnliche, RNA-spaltende Eigenschaft und 
steigert so deren Effizienz bei der Inaktivierung der Ziel-RNA. 
25 Die Herstellung und Verwendung entsprechender Ribozym- "ant i - 
sense"-RNA-Molekule ist beschrieben (u.a. bei Haseloff et al . 
(1988) Nature 334: 585-591); Haselhoff und Gerlach (1988) Nature 
334:585-591; Steinecke P et al . (1992) EMBO J 11(4):1525- 1530; 
de Feyter R et al . (1996) Mol Gen Genet. 250 ( 3 ): 329-338 ) . 

30 

Auf diese Art konnen Ribozyme (z.B. "Hammerhead" -Ribozyme; 
Haselhoff und Gerlach (1988) Nature 334:585-591) verwendet 
werden, um die mRNA eines zu vermindernden Markerproteins 
katalytisch zu spalten und so die Translation zu verhindern. 

35 Die Ribozym-Technologie kann die Effizienz einer antisense- 
Strategie erhdhen. Verf ahren zur Expression von Ribozymen 
zur Verminderung bestimmter Proteine sind beschrieben in 
(EP 0 291 533, EP 0 321 201, EP 0 360 257). In pflanzlichen 
Zellen ist eine Ribozym-Expression ebenfalls beschrieben 

40 (Steinecke P et al. (1992) EMBO J 11 (4) : 1525-1530 ; de Feyter R 
et al. (1996) Mol Gen Genet. 250 (3) :329-338) . Geeignete Ziel- 
sequenzen und Ribozyme konnen zum Beispiel wie bei ''Steinecke P, 
Ribozymes, Methods in Cell Biology 50, Galbraith et al . eds , 
Academic Press, Inc. (1995), S. 449-460" beschrieben, durch 

45 Sekundarstrukturberechnungen von Ribozym- und Ziel-RNA sowie 

durch deren Interaktion bestimmt werden (Bayley CC et al. (1992) 
Plant Mol Biol. 18 (2 ): 353-361 ; Lloyd AM and Davis RW et al . 
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(1994) Mol Gen Genet. 242 (6) : 653-657) . Beispielsweise konrien 
Derivate der Tetrahymena L-19 IVS RNA konstruiert werden, die 
komplementare Bereiche zu der mRNA des zu supprimierenden Marker- 
proteins aufweisen (siehe auch US 4,987,071 und US 5,116,742). 
5 Alternativ konnen solche Ribozyme auch liber einen Selektions- 
prozess aus einer Bibliothek diverser Ribozyme identif iziert 
werden (Bartel D und Szostak JW (1993) Science 261:1411-1418). 

d) Einbringen einer sense-Ribonukleinsauresequenz eines Marker- 
10 proteins (MP-senseRNA) zur Induktion einer Kosuppression 

Die Expression einer Markerprotein Ribonukleinsauresequenz 
(oder eines Teils derselben) in sense-Orientierung kann zu einer 
Kosuppression des entsprechenden Markerproteingens fuhren. Die 

15 Expression von sense-RNA mit Homologie zu einem endogenen Marker - 
proteingen kann die Expression desselben vermindern oder aus- 
schalten, ahnlich wie es fur antisense Ansatze beschrieben wurde 
(Jorgensen et al. (1996) Plant Mol Biol 31 (5 ): 957-973 ; Goring 
et al. (1991) Proc Natl Acad Sci USA 88:1770-1774; Smith et al . 

20 (1990) Mol Gen Genet 224:447-481; Napoli et al. (1990) Plant Cell 
2:279-289; Van der Krol et al . (1990) Plant Cell 2:291-99). Dabei 
kann das eingefuhrte Konstrukt das zu vermindemde , homologe 
Gen ganz oder nur teilweise reprasentieren. Die Moglichkeit 
zur Translation ist nicht erf orderlich. Die Anwendung dieser 

25 Technologie auf Pflanzen ist beschrieben (z.B. Napoli et al . 
(1990) Plant Cell 2:279-289; in US 5,034,323. 

Bevorzugt wird die Kosuppression unter Verwendung einer Sequenz 
realisiert, die im wesentlichen identisch ist zu zumindest einem 
3 0 Teil der Nukleinsauresequenz kodierend fur ein Markerprotein, 
beispielsweise der Nukleinsauresequenz gemaS SEQ ID NO: 1, 3, 
5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29 ,31, 33, 35, 
37, 39, 41, 43, 45 oder 47. 

35 Bevorzugt ist die MP-senseRNA so gewahlt, dass es nicht zu einer 
Translation des Markerproteins oder eines Teils desselben kommen 
kann. Dazu kann beispielsweise der 5 ' -untranslatierte oder 
3 ' -untranslatierte Bereich gewahlt oder aber das ATG-Startkodon 
deletiert oder mutiert werden. 



40 



e) Einbringen von DNA-oder Protein-bindende Faktoren gegen 
Markerprotein Gene, — RNAs oder Proteine 



Eine Verminderung einer Markerprotein Expression ist auch mit 
45 spezifischen DNA-bindenden Faktoren z.B. mit Faktoren vom Typ der 
Zinkf ingertranskript ions faktoren moglich. Diese Faktoren lagern 
sich an die genomische Sequenz des endogenen Zielgens, bevor- 
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zugt in den regulatorischen Bereichen, an und bewirken eine Ver- 
minderung der Expression. Entsprechende Verfahren zur Herstellung 
entsprechender Faktoren sind beschrieben (Dreier B et al. (2001) 
J Biol Chem 276 (31) : 29466-78; Dreier B et al . (2000) J Mol 
Biol 303 (4) :489-502; Beerli RR et al. (2000) Proc Natl Acad 
Sci USA 97 (4) :1495-1500; Beerli RR et al . (2000) J Biol Chem 
275(42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opin Chem Biol 4(l):34-39; Kang JS and Kim JS (2000) J Biol Chem 
275(12) :8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sci USA 
95 (25) :14628- 14633; Kim JS et al . (1997) Proc Natl Acad Sci USA 
94(8):3616 -3620; Klug A (1999) J Mol Biol 293 (2 ): 215-218; Tsai 
SY et al. (1998) Adv Drug Deliv Rev 30(1-3) : 23-31; Mapp AK et al. 
(2000) Proc Natl Acad Sci USA 97 (8 ): 3930-3935 ; Sharrocks AD 
et al. (1997) Int J Biochem Cell Biol 29 (12) : 1371-1387 ; Zhang L 
et al. (2000) J Biol Chem 275 (43) : 33850-33860) . 

Die Selektion dieser Faktoren kann unter Verwendung eines 
beliebigen Stuckes eines Markerprotein-Gens erfolgen. Bevorzugt 
liegt dieser Abschnitt im Bereich der Promo tor region. Fur eine 
Genunterdruckung kann er aber auch im Bereich der kodierenden 
Exons oder Introns liegen. 

Ferner konnen Faktoren in eine Zelle eingebracht werden, die das 
Markerprotein selber inhibieren. Diese proteinbindenden Faktoren 
konnen z.B. Aptamere (Famulok M und Mayer G (1999) Curr Top 
Microbiol Immunol 243:123-36) oder Antikorper bzw. Antikorper- 
fragmente oder einzelkettige Antikorper sein. Die Gewinnung die- 
ser Faktoren ist beschrieben (Owen M et al . (1992) Biotechnology 
(N Y) 10 (7) :790-794; Franken E et al . (1997) Curr Opin Biotechnol 
8 (4) :411-416; Whitelam (1996) Trend Plant Sci 1:286-272). 

f ) Einbringen von den Markerprotein RNA-Abbau bewirkenden 

viralen Nukleinsauresequenzen und Expressionskonstrukten 

Die Markerprotein Expression kann effektiv auch durch Induktion 
des spezif ischen Markerprotein RNA-Abbau s durch die Pflanze 
mit Hilfe eines viralen Expressionssystems (Amplikon; Angell 
SM et al. (1999) Plant J 20 (3 ): 357-362 ) realisiert werden. 
Diese Systeme - auch als "VIGS" (viral induced gene silencing) 
bezeichnet - bringen Nukleinsauresequenzen mit Homologie 
zu dem Transkript eines zu vermindernden Markerproteins 
mittels viraler Vektoren in die Pflanze ein. Die Transkription 
wird sodann - vermutlich mediiert durch pflanzliche Abwehr- 
mechanismen gegen Viren - abgeschaltet . Entsprechende Techniken 
und Verfahren sind beschrieben (Ratcliff F et al. (2001) Plant J 
45 25 (2) :237-45; Fagard M und Vaucheret H (2000) Plant Mol Biol 
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43 (2-3) :285-93 ; Anandalakshmi R et al . (1998) Proc Natl Acad Sci 
USA 95(22) :13079-84; Ruiz MT (1998) Plant Cell 10 ( 6 ) : 937-46 ) . 

Bevorzugt wird die VIGS-vermittelte Verminderung unter Verwendung 
5 einer Sequenz realisiert, die im we sent lichen identisch ist 
zu zumindest einem Teil der Nukleinsauresequenz kodierend fiir 
ein Markerprotein, beispielsweise der Nukleinsauresequenz gemaS 
SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 
29, 31, 33, 35, 37, 39, 41, 43, 45 oder 47. 

.0 

g) Einbringen von Konstrukten zur Erzeugung eines Funktions- 
verlustes oder einer Funktionsminderung an Markerprotein- 
Genen 



15 Dem Fachmann sind zahlreiche Verfahren bekannt, wie genomische 
Sequenzen gezielt modifiziert werden konnen. Dazu zahlen ins- 
besondere Verfahren wie die Erzeugung von Knockout-Mutanten 
mittels gezielter homologen Rekombination z.B. durch Generierung 
von Stopp-Kodons , Verschiebungen im Leseraster etc. (Hohn B und 

20 Puchta H (1999) Proc Natl Acad Sci USA 96:8321-8323) oder die 
gezielte Deletion oder Inversion von Sequenzen mittels z.B. 
sequenzspezif ischer Rekombinasen oder Nukleasen (s.u.) 

In einer bevorzugten Ausfiihrungsf orm wird die Inaktivierung des 
25 Markerprotein-Gens durch Einbringen einer sequenzspezif ischen 

Rekombinase realisiert. So kann beispielsweise das Markerprotein- 
gen Erkennungs sequenzen fiir sequenzspezif ische Rekombinasen 
umfassen oder von solchen flankiert sein, wobei dann durch 
Einbringen der Rekombinase bestimmte Sequenzen des Markerprotein- 
30 gens deletiert oder invertiert werden und so eine Inaktivierung 
des Markerproteinsgens erf olgt . Ein entsprechendes Vorgehen ist 
schematisch in Fig. 1 dargestellt . 

Entsprechende Verfahren zur Deletion/Inversion von Sequenzen 
35 mittels sequenzspezif ischer Rekombinasesysteme sind dem Fachmann 
bekannt. Beispielhaft seien zu nennen das Cre/lox-System des 
Bacteriophagen PI (Dale EC und Ow DW (1991) Proc Natl Acad 
Sci USA 88:10558-10562; Russell SH et al . (1992) Mol Gen Genet 
234:49-59; Osborne BI et al . (1995) Plant J 7:687-701), das FLP/ 
40 FRT System der Hefe (Kilby NJ et al. (1995) Plant J 8:637-652; 
Lyznik LA et al . (1996) Nucl Acids Res 24:3784-3789), die Gin 
Rekombinase des Mu Phagen, die Pin Rekombinase aus E.coli oder 
das R/RS System des pSRl Plasmids (Onouchi H et al.(1995) Mol Gen 
Genet 247:653- 660; Sugita Ket al . (2000) Plant J. 22:461-469). 
45 Bei diesen Systemen interagiert die Rekombinase (beispielsweise 
Cre oder FLP) spezifisch mit ihren jeweiligen Rekombinations- 
sequenzen (34 bp lox-Sequenz bzw. 47 bp FRT-Sequenz) . Bevorzugt 



WO 2004/013333 PCT/EP2003/007877 

33 

sind das Bacteriophagen PI Cre/lox und das Hefe FLP/FRT System. 
Das FLP/FRT und cre/lox Rekombinasesystem wurde bereits in 
pflanzlichen Systemen angewendet (Odell et al. (1990) Mol 
Gen Genet 223:369-378) . Das Einbringen der Rekombinase wird 
5 bevorzugt mittels rekombinanter Expression ausgehend von einer 
auf einem DNA-Konstrukt umfassten Expressionskassette realisiert. 

Die Verminderung der Markerprotein-Aktivitat oder -Menge kann 
auch durch eine gezielte Deletion im Markerprotein-Gen z.B. durch 

10 sequenzspezifische Induktion von DNA-Doppelstrangbruchen an einer 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
briichen in oder in der Nahe der Nukleinsauresequenz kodierend 
fur ein Markerprotein realisiert werden. In seiner einfachsten 
Ausfuhrungsform (vgl . Fig. 2, A und B) wird hierbei ein Enzym 

15 init dem Trans formationskonstrukt eingebracht, dass mindestens 
einen Doppelstrangbruch derart erzeugt, dass die resultierende 
illegitime Rekombination oder Deletion eine Verminderung der 
Markerprotein-Aktivitat oder -Menge - beispielsweise durch 
Induzieren einer Verschiebung im Leseraster oder Deletion 

20 essentieller Sequenzen - bewirkt. 

Die Effizienz dieses Ansatz kann gesteigert werden, indem die 
Sequenz kodierend fur das Markerprotein von Sequenzen (A bzw. A' ) 
flankiert ist, die eine ausreichende Lange und Homologie zuein- 

25 ander haben, urn infolge des induzierten Doppelstrangbruches mit- 
einander zu rekombinieren und so - durch eine intramolekulare 
homologe Rekombination - eine Deletion der Sequenz kodierend fur 
das Markerprotein zu bewirken. Ein entsprechendes Vorgehen ist 
in einer beispielhaf ten Ausfuhrungsform dieser Variante in Fig. 3 

30 schematisch dargestellt. 

Die Verminderung der Markerprotein-Menge , -Funktion und/oder - 
Aktivitat kann auch durch eine gezielte Insertion von Nuklein- 
sauresequenzen (z.B. der im Rahmen der erf indungsgemaSen Ver- 

35 fahrens zu insertierenden Nukleinsauresequenz) in die Sequenz 
kodierend fur ein Markerprotein (z.B. mittels intermolekularer 
homologer Rekombination) realisiert werden. Diese Ausfuhrungsform 
des erf indungsgemaSen Verfahrens ist besonders vorteilhaft und 
bevorzugt, da es neben den allgemeinen Vorteilen des erfindungs- 

40 gemaSen Verfahrens zudem noch eine reproduzierbare, vorhersag- 
bare, ortsspezif ische Insertion der zu insertierenden Nuklein- 
sauresequenz in das pflanzliche Genom ermoglicht. Dadurch werden 
die ansonsten im Rahmen einer zufalligen, ortsunspezif ischen 
Insertion auftretenden Positionsef f ekte (die sich beispielsweise 

45 in Form von unterschiedlichen Expressionshohen des Transgens oder 
einer unbeabsichtigen Inaktivierung endogener Gene aufiern konnen) 
vermieden. Im Rahmen dieser Ausftthrungsf orm verwendet man als 
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"anti-Markerprotein"-Verbindung bevorzugt ein DNA-Konstrukt , 
das zumindest einen Teil der Sequenz eines Markerproteingens 
oder benachbarter Sequenzen umfasst, und so mit diesen in 
der Zielzelle gezielt rekombinieren kann, so dass durch eine 
5 Deletion, Addition oder Substitution mindestens eines Nukleotids 
das Markerproteingen so verandert wird, dass die Funktionalitat 
des Markerprotein-Gens vermindert oder ganzlich aufgehoben wird. 
Die Veranderung kann auch die regulativen Elemente (z.B. 
den Promotor) des Markerprotein-Gens betreffen, so dass 
10 die kodierende Sequenz unverandert bleibt, eine Expression 
(Transkription und/oder Translation) jedoch unterbleibt und 
vermindert wird. Bei der konventionellen homologen Rekombination 
ist die zu insertierende Sequenz an ihrem 5'- und/oder 3 ' -Ende 
von weiteren Nukleinsauresequenzen (A' bzw. B') flankiert, die 
15 eine ausreichende Lange und Homologie zu entsprechenden Sequenzen 
des Markerprotein-Gens (A bzw. B) fur die Ermoglichung der homo- 
logen Rekombination aufweisen. Die Lange liegt in der Regel in 
einem Bereich von mehreren hundert Basen bis zu mehreren Kilo- 
basen (Thomas KR und Capecchi MR (1987) Cell 51:503; Strepp 
20 et al. (1998) Proc Natl Acad Sci USA 95 ( 8 ): 4368-4373 ) . Fur 

die homologe Rekombination wird die pflanzliche Zelle mit dem 
Rekombinationskonstrukt unter Verwendung der unten beschriebenen 
Verfahren transf ormiert und erfolgreich rekombinierte Klone 
basierend auf dem infolge inaktivierten Markerprotein selektio- 
25 niert. Obgleich homologe Rekombination ein relativ seltenes 

Ereignis in pflanzlichen Organismen ist, kann durch die Rekombi- 
nation in das Markerprotein-Gen hinein einem Selektionsdruck aus- 
gewichen werden, was eine Selektion der rekombinierten Zellen 
und eine hinreichende Effizienz des Verfahrens erlaubt . Ein ent- 
30 sprechendes Vorgehen ist in einer beispielhaf ten Ausf uhrungsf orm 
dieser Variante in Fig. 4 schematisch dargestellt . 

In einer vorteilhaf ten Ausf uhrungsf orm der Erfindung wird 
jedoch die Insertion in das Markerproteingen mittels weiterer 

35 Funktionselemente erleichtert. Der Begriff ist umfassend zu ver- 
stehen und meint die Verwendung von Sequenzen bzw. von diesen 
abgeleiteten Transkripten oder Polypeptides die die Effizienz 
der gezielten Integration in ein Markerprotein-Gen zu steigern 
vermogen. Dazu stehen dem Fachmarm verschiedene Verfahren zur 

40 Verfiigung. Bevorzugt wird jedoch die Insertion durch Induktion 
eines sequenz spezifischen Doppelstrangbruches in oder in der 
Nahe des Markerprotein-Gens realisiert. 

In einer bevorzugte Ausf uhrungsf orm der Erfindung wird die 
45 Inaktivierung (d.h. die Verminderung der Menge, Expression, 
Aktivitat oder Funktion) des Markerproteins durch Integration 
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einer DNA-Sequenz in ein Markerprotein-Gen realisiert, wobei 
das Verfahren bevorzugt nachfolgende Schritte umfasst: 

i) Einbringen eines Insertionskonstruktes und mindestens eines 
5 Enzyms geeignet zur Induktion von DNA-Doppelstrangbriichen 

an einer Erkennungssequenz zur gezielten Induktion von DNA- 
Doppelstrangbriichen in Oder in der Nahe des Markerprotein- 
Gens , und 

ii) Induktion von DNA-Doppelstrangbriichen an den Erkennungs- 
10 sequenzen zur gezielten Induktion von DNA-Doppelstrang- 
briichen in oder in der Nahe des Markerprotein-Gens , und 

iii) Insertion des Insertionskonstruktes in das Markerprotein- 
Gen, wobei die Funktionalitat des Markerprotein-Gens und 

15 - bevorzugt - die Funktionalitat der Erkennungssequenz zur 

gezielten Induktion von DNA-Doppelstrangbriichen inaktiviert 
wird, so dass besagte Erkennungssequenz nicht mehr durch 
das Enzym geeignet zur Induktion von DNA-Doppelstrang- 
briichen geschnitten werden kann, und 

20 

iV) Selektion von Pflanzen oder pflanzlichen Zellen, bei denen 
das Insert ionskonstrukt in das Markerproteingen insertiert 
wurde . 

25 Das Insertionskonstrukt umfasst - bevorzugt - die in das Genom 
zu insertierende Nukleinsauresequenz , kann aber auch separat von 
dieser eingesetzt werden. 

"Enzym geeignet zur Induktion von DNA-Doppelstrangbriichen an der 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
30 briichen" (infolge "DSBI-Enzym" fur "double s.trand-fereak inducing 
enzyme " ) meint allgemein all solche Enzyme, die in der Lage sind, 
sequenzspezif isch Doppelstrangbriiche in doppelstrangige DNA 
zu erzeugen. Beispielsweise, aber nicht einschrankend, sind 
zu nennen: 

35 

1. Restriktionsendonukleasen, bevorzugt Typ II Restriktionsendo- 
nukleasen, besonders bevorzugt Homing-Endonukleasen wie 
weiter unten im Detail beschrieben. 

40 2. Kiinstliche Nukleasen wie weiter unten im Detail beschrieben, 
wie beispielsweise chimare Nukleasen, mutierte Restriktions- 
oder Homing-Endonukleasen oder RNA-Proteinpartikel abgeleitet 
von mobilen Introns der Gruppe II. 



45 Sowohl natiirliche als auch kiinstlich hergestellte DSBI-Enzyme 
sind geeignet. Bevorzugt sind all solche DSBI-Enzyme, deren 
Erkennungssequenz bekannt ist und die entweder in Form ihrer 
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Proteine (beispielsweise durch Auf reinigung) gewonnen oder unter 
Verwendung ihrer Nukleinsauresequenz exprimiert werden konnen. 

Bevorzugt wird das DSBI-Enzym unter Kenntnis seiner spezifischen 
5 Erkennungssequenz so ausgewahlt, dass es zusatzlich zu der Ziel- 
Erkennungssequenz keine weitere funktionellen Erkennungsregionen 
im Genom der Zielpflanze besitzt. Ganz besonders bevorzugt sind 
deshalb Homing-Endonukleasen (Ubersicht: Belfort M und Roberts RJ 
(1997) Nucleic Acids Res 25:3379-3388; Jasin M (1996) Trends 
10 Genet 12:224-22 8; Internet: http://rebase.neb.com/rebase/rebase. 
homing.html; Roberts RJ and Macelis D (2001) Nucl Acids Res 29: 
268-269) . Diese erfiillen aufgrund ihrer langen Erkennungs- 
seguenzen diese Anforderung. Die fur derartige Homing-Endo- 
nukleasen kodierenden Sequenzen konnen beispielsweise aus dem 
15 Chloroplastengenom von Chlamydomonas isoliert werden (Turmel M 
et al. (1993) J Mol Biol 232:446-467). Geeignete Homing-Endo- 
nukleasen sind unter der oben angegebenen Int erne t-Adr esse auf- 
gefuhrt. Zu nennen sind beispielsweise Homing-Endonukleasen wie 
F-Scel, F-Scell, F-Suvl, F-TevI, F-TevII, I-Amal, I -Anil, I-Ceul, 
20 I-CeuAIIP, I-Chul, I-Cmoel, I-Cpal, I-CpaII, I-Crel, I-CrepsbIP, 
I-CrepsbIIP, 1-CrepsbIIIP, I-CrepsbIVP, I-CsmI, I-Cvul, I-CvuAIP, 
I-DdiII, I-Dirl, I-Dmol, I-HspNIP, I-Llal, I-Msol, I-Naal, 
I-NanI, I-NclIP, I-NgrIP, I-NitI, I-Njal, I-Nsp236lP, I-PakI, 
I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-Porl, 
25 I-PorIIP, I-PpbIP, I-Ppol, I-SPBetaIP, I-Scal, I-Scel, I-SceII, 
I-SceIII , I-SceIV, I-SceV, I-SceVI, I-SceVII, I-SexIP, I-SneIP, 
I-SpomCP, 1-SpomIP, I-SpomIIP, I-SquIP, I-Ssp6803I, I-SthPhiJP, 
I-SthPhiST3P, I-SthPhiS3bP / I-TdeIP, I-TevI, I-TevII, I-TevIII, 
I-UarAP, I-UarHGPAlP, I-UarHGPAl3P, I-VinIP, I-ZbiIP, PI-MtuI, 
30 PI-MtuHIP, PI-MtuHIIP, Pl-Pful, Pl-PfuII, Pl-Pkol, Pl-PkoII, 

PI-PspI, PI-Rma43812IP, PI-SPBetalP, Pl-Scel , PI-Tful, PI-TfuII, 
PI-Thyl, PI-Tlil, PI-Tlill. Bevorzugt sind dabei die Homing- 
Endonukleasen, deren Gensequenzen bereits bekannt sind, wie 
beispielsweise F-Scel, I-Ceul , I-Chul, I-Dmol, I-Cpal, I-CpaII, 
35 I-Crel, I-CsmI, F-TevI, F-Tevll, I-TevI, I-TevII, I-Anil, I-Cvul, 
I-Llal, I-NanI, I-Msol, I-NitI, I-Njal, I-PakI, I-Porl, I-Ppol, 
I-Scal, I-Ssp6803I, Pl-Pkol, Pl-PkoII, PI-PspI, PI-Tful, PI-Tlil. 

Ganz besonders bevorzugt sind 

40 

I-Ceul (Cote MJ und Turmel M (1995) Curr Genet 27:177-183.; 
Gauthier A et al . (1991) Curr Genet 19:43-47; Marshall (1991) 
Gene 104:241-245; GenBank Acc.-No.: Z17234 Nukleotide 5102 
bis 5758) , 

45 
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I-Chul (Cote V et al.(1993) Gene 129:69-76; GenBank Acc.-No.: 
L06107, Nukleotide 419 bis 1075), 

I-Cmoel (Drouin M et al. (2000) Nucl Acids Res 28:4566- 
4572) , 

I-Cpal aus Chlamydomonas pallidostigmatica (GenBank Acc.-No.: 
L36830, Nukleotide 357 bis 815; Tunnel Met al . (1995) 
Nucleic Acids Res 23:2519-2525; Turmel, M et al . (1995) 
Mol Biol Evol 12:533-545) 

I-CpaII (Turmel M et al. (1995) Mol Biol Evol 12:533-545; 
GenBank Acc.-No.: L39865, Nukleotide 719 bis 1423), 

I-Crel (Wang J et al . (1997) Nucleic Acids Res 25: 3767-3776; 
Durrenberger, F und Rochaix JD (1991) EMBO J 10:3495-3501; 
GenBank Acc.-No.: X01977, Nukleotide 571 bis 1062), 

I-CsmI (Ma DP et al . (1992) Plant Mol Biol 18:1001-1004) 

I-Nanl (Elde M et al . (1999) Eur J Biochem. 259:281-288; 
GenBank Acc.-No.: X78280, Nukleotide 418 bis 1155), 

I-NitI (GenBank Acc.-No.: X78277, Nukleotide 426 bis 1163), 

I-Njal (GenBank Acc.-No. : X78279, Nukleotide 416 bis 1153), 

I-Ppol (Muscarella DE und Vogt VM (1989) Cell 56:443-454; 
Lin J und Vogt VM (1998) Mol Cell Biol 18:5809-5817; GenBank 
Acc.-No.: M38131, Nukleotide 86 bis 577), 

I-Pspl (GenBank Acc.-No. : U00707, Nukleotide 1839 bis 3449), 

I-Scal (Monteilhet C et al . (2000) Nucleic Acids Res 28: 
1245-1251; GenBank Acc.-No.: X95974, Nukleotide 55 bis 465) 

I-Scel (WO 96/14408; US 5,962,327 dort Seq ID NO: 1), 

Endo Seel (Kawasaki et al . (1991) J Biol Chem 266:5342-5347, 
identisch zu F-Scel; GenBank Acc.-No.: M63839, Nukleotide 
159 bis 1589) , 



I-Scell (Sarguiel B et al . (1990) Nucleic Acids Res 
18:5659-5665) , 
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I-Ssp6803I (GenBank Acc.-No.: D64003, Nukleotide 35372 bis 
35824) , 



10 



I-TevI (Chu et al. (1990) Proc Natl Acad Sci USA 
87:3574-3578; Bell-Pedersen et al. (1990) Nucleic Acids 
Resl8:3763-3770; GenBank Acc.-No.: AF158101, Nukleotide 
144431 bis 143694) , 



I-TevII (Bell-Pedersen et al. (1990) Nucleic Acids Res 
18: 3763-3770; GenBank Acc.-No.: AF158101, Nukleotide 45612 
bis 44836) , 



15 



I-TevIII (Eddy et al . (1991) Genes Dev. 5:1032-1041), 

Ganz besonders bevorzugt sind kommerziell erhaltliche Homing- 
Endonukleasen wie I-Ceul, I-Scel, I-Ppol, PI-PspI oder Pl-Scel. 

20 Am meisten bevorzugt sind I-Scel und I-Ppol . Wahrend das Gen 

kodierend fur I-Ppol in der natiirlichen Form genutzt werden kann, 
besitzt das Gen kodierend fur I-Scel eine Editierstelle . Da die 
entsprechende Editierung in hoherer Pf lanzen im Unterschied zu 
den Mitochondrien der Hefe nicht durchgefiihrt wird, muss eine 

25 kunstliche das I-Scel Protein kodierende Sequenz zur hetero- 

logen Expression dieses Enzyms eingesetzt werden (US 5,866,361). 

Die Enzyme konnen in der dem Fachmann gelauf igen Art und Weise 
aus ihren Herkunf tsorganismen aufgereinigt und/oder die fur sie 
30 kodierende Nukleinsauresecjuenz kloniert werden. Die Sequenz en 
verschiedener Enzyme sind in der GenBank hinterlegt (s.o.). 

Als kunstliche DSBI-Enzyme seien beispielhaft chimare Nukleasen 
zu nennen, die sich aus einer unspezif ischen Nukleasedomane und 

35 einer secjuenzspez if ischen DNA-Bindungsdomane (z.B. bestehend aus 
Zinkfingern) zusammensetzen (Smith J et al . (2000) Nucl Acids 
Res 28(17) :3361-3369; Bibikova M et al . (2001) Mol Cell Biol. 
21:289-297). So wurde beispielsweise die katalytische Domane 
der Restriktionsendonuklease Fokl an Zinkf ingerbinde-Domanen 

40 fusioniert, wodurch die Spezifitat der Endonuklease definiert 
wurde (Chandrasegaran S & Smith J (1999) Biol Chem 380:841-848; 
Kim YG & Chandrasegaran S (1994) Proc Natl Acad Sci USA 
91:883-887; Kim YG et al . (1996) Proc Natl Acad Sci USA 
93:1156-1160). Auch die katalytische Domane der Ho-Endonuklease 

45 aus Hefe konnte bereits mit der beschriebenen Technik eine vor- 
definierte Spezifitat verliehen werden, indem diese an die Zink- 
fingerdomane von Trans kript ions f aktoren fusioniert wurde (Nahon 
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& Raveh D (1998) Nucl Acids Res 26:1233-1239). Durch geeignete 
Mutations- und Selektionsverf ahren kann man bestehende Homing- 
Endonukleasen an jede gewunschte Erkennungssequenz anpassen. 

5 Wie erwahnt, eignen sich insbesondere Zinkf ingerproteine als 
DNA-Bindungsdomane im Rahmen von chimaren Nukleasen. Diese DNA— 
bindenden Zinkf ingerdomanen konnen an jede beliebige DNA-Sequenz 
angepasst werden. Entsprechende Verf ahren zur Herstellung 
entsprechender zinkf ingerdomanen sind beschrieben und dem 

10 Fachmann bekannt (Beerli RR et al. (2000) Proc Natl Acad 
Sci 97 (4) :1495-1500; Beerli RR et al.(2000) J Biol Chem 
275(42) :32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opin Chem Biol 4(l):34-39; Kang JS and Kim JS (2000) J Biol Chem 
275(12) :8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sci USA 

15 95(25) :14628-14633; Kim JS et al . (1997) Proc Natl Acad Sci USA 
94(8) :3616-3620; Klug A (1999) J Mol Biol 293 (2) : 215-218 ; Tsai 
SY et al. (1998) Adv Drug Deliv Rev 30 (1-3) : 23-31; Mapp AK et al . 
(2000) Proc Natl Acad Sci USA 97 ( 8 ): 3930-3935 ; Sharrocks AD 
et al. (1997) Int J Biochem Cell Biol 29 (12) :1371-1387; Zhang L 

20 et al. (2000) J Biol Chem 275 (43) : 33850-33860) . Verfahren zur 
Herstellung und Selektion von Zink-Finger DNA-Bindedomanen 
mit hoher Sequenzspezif itat sind beschrieben (WO 96/06166, 
WO 98/53059, WO 98/53057). Durch Fusion einer so erhaltenen 
DNA-Bindedomane an die katalytische Domane einer Endonuklease 

25 (wie beispielsweise der Fokl oder Ho-Endonuklease) kann man 
chimare Nukleasen mit jeder beliebigen Spezifitat herstellen, 
die als DSBI-Enzyme im Rahmen der vorliegenden Erfindung vorteil- 
haft eingesetzt werden konnen. 

30 Kiinstliche DSBI-Enzyme mit veranderter Sequenzspezif itat konnen 
auch durch Mutagenese bereits bekannter Restriktionsendonukleasen 
oder Homing Endonukleasen durch dem Fachmann gelauf ige Methoden 
erzeugt werden. Insbesondere von Interesse ist neben der Muta- 
genese von Homing-Endonukleasen mit dem Ziel, eine veranderte 

35 Substratspezif itat zu erzielen, auch die Mutagenese von Matu- 
rasen. Maturasen haben haufig viele Gemeinsamkeiten mit Homing- 
Endonukleasen und lassen sich durch wenige Mutationen ggf . in 
Nukleasen umwandeln. Dies wurde beispielsweise fur die Maturase 
im bi2 Intron der Backerhefe gezeigt. Lediglich zwei Mutationen 

40 in dem die Maturase kodierenden offenen Leseraster (ORF) reichten 
aus, diesem Enzym eine Homing-Endonuklease Aktivitat zu verleihen 
(Szczepanek & Lazowska (1996) EMBO J 15:3758-3767). 

Wei t ere kiinstliche Nukleasen konnen mit Hilfe mobiler Gruppe II 
45 introns und den von ihnen kodierten Proteinen oder Teile dieser 
Proteine erzeugt werden. Mobile Gruppe II Introns bilden mit 
den von ihnen kodierten Proteinen RNA-Protein-Partikel, die 
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sequenzspezif isch DNA erkennen und schxieiden konnen. Die Sequenz- 
spezifitat kann dabei durch Mutagenese von bestimmten Bereichen 
des Introns (siehe unten) den Bediirfnissen angepasst werden 
(WO 97/10362) . 

5 

Bevorzugt wird das DSBI-Enzym als Fusionsprotein mit einer Kern- 
lokalisationssequenz (NLS) exprimiert. Diese NLS-Sequenz ermog- 
licht einen erleichterten Transport in den Kern und steigert die 
Effizienz des Rekombinationssystems . Verschiedene NLS-Sequenzen 
10 sind dem Fachmann bekannt und unter anderem beschrieben bei 

Jicks GR und Raikhel NV (1995) Annu. Rev. Cell Biol. 11:155-188. 
Bevorzugt ftir pflanzliche Organismen ist beispielsweise die NLS— 
Sequenz des SV40 "large antigen" . Ganz besonders bevorzugt sind 
die nachf olgenden NLS-Sequenzen: 

15 

NLS1 : N-Pro-Lys-Thr-Lys-Arg-Lys-Val-C 



NLS2: 



N-Pro-Lys-Lys-Lys-Arg-Lys-Val-C 



20 Aufgrund der geringen Gr6£e vieler DSBI-Enzyme (wie beispiels- 
weise der Homing-Endonukleasen) ist jedoch eine NLS-Sequenz 
nicht zwingend erf orderlich. Diese Enzyme konnen die Kernporen 
auch ohne die Unterstutzung passieren. 

25 "Erkennungs sequenz zur gezielten Induktion von DNA-Doppel- 
strangbruchen" meint allgemein solche Sequenzen, die unter 
den Bedingungen in der jeweils verwendeten eukaryotischen 
Zelle oder Organismus die Erkennung und Spaltung durch das 
DSBI-Enzym erlauben. Beispielhaft aber nicht einschrankend 

30 seien dabei in nachf olgender Tabelle 1 die Erkennungssequenzen 
fur die jeweiligen aufgefuhrten DSBI-Enzyme genannt . 

Tabelle 1: Erkennungssequenzen und Herkunf tsorganismus von DSBI- 
Enzymen gibt innerhalb einer Erkennungssequenz 

35 die Schnittstelle des DSBI-Enzyms an) 



DSBI-Enzym 


Herkunf ts- 
organismus 


Erkennungssequenz 


CRE 


Bacteriophage 
PI 


5 ' -AACTCTCATCGCTTCGGATAACTTCCTGTTATCCGAAACAT 
ATCACTCACTTTGGTGATTTCACCGTAACTGTCTATGATTAATG 
-3' 


FLP 


Saccharomyces 
cerevisiae 


5 ' -GAAGTTCCTATTCCGAAGTTCC TATTCTC TAGAAAGTA - 
TAGGAACTTC-3 ' 


R 


pSRl 
Plasmids 


5 ' -CGAGATCATATCACTGTGGACGTTGATGAAAGAATACGTTA 
TTCTTTCATCAAATCGT 


P-Element 

Transpo- 

sase 


Drosophila 


5 ' - C TAGATG AAATAAC ATAAGGTGG 



40 
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DSBI-Enzym 


Herkunf ts~ 
organismus 


Er kennungs s equenz 




I- 


-Anil 


Aspergillus 
nidulans 


5' 
3' 


— TTGAGGAGGTT * TCTCTGTAAATAAMWNISJT^ 
-AACTCCTCCAAAGAGACATTTATTNNlvflSnSn^ 


5 


I- 


-Deli I 


Dictyostelium 
di s co i deumAX3 


5 ' 
3' 


— TTTTTTGGTP ATC C AGA AGT AT AT 
- AAAAAACC AG A TAGGTCTTC AT ATA 




I- 


-Cvul 


Chlorella 
vulgaris 


5 ' 
3' 


— CTGGGTTCAAAACGTCGTGA * fiAP AnTTTf^Tl 
-GACCC AAGTTTTGC AG A C ACTCTGTCAAACC 


10 


I- 


-CsmI 


Chlamydomonas 
smithii 


5' 


-GTACTAGCATGGGGTCAAATGTCTTTCTGG 


I- 


-Cmoel 


Chi amydomo - 
nasmoewusii 


5' 
3 ' 


-TCGTAGC AGC T A CACGGTT 
-AGCATCG A TCGAGTGCC AA 




I- 


-Crel 


Chi amydomonas 
reinhardtii 


5' 
3 ' 


-CTGGGTTCAAAACGTCGTGA * GACAGTTTGG 
- GACCCAAGTTTTGCAG A CACTCTGTC AAACC 


15 


I- 


-Chul 


Ch 1 amydomonas 
humicola 


5 ' 
3 ' 


-GAAGGTTTGGCACCTCG^ATGTCGGCTCATC 
-CTTCCAAACCGTG A GAGCTACAGCCGAGTAG 




I- 


-Cpal 


wiii. cut i_y uuiuuilclo 

pallidosbig- 
matica 


5 ' 
3' 


-CGATCCTAAGGTAGCGAA A ATTCA 
- GCTAGGATTCCATC A GCTTTAAGT 


20 


I- 


-Cpall 


Chi amydomonas 

pallidostig- 

matica 


5 ' 
3' 


-CCCGGCTAACTC A TGTGCCAG 
-GGGCCGAT A TGAGACACGGTC 




I- 


-Ceul 


Chlamydomonas 
eugametos 


5' 
3 ' 


-CGTAACTATAACGGTCCTAA A GGTAGCGAA 
- GC ATTGAT ATTGCC AG A GATTCC ATC GCTT 


25 


I- 


-Dmol 


Desulfurococ- 
cus mobilis 


5' 
3 ' 


-ATGCCTTGCCGGGTAA A GTTCCGGCGCGCAT 
-TACGGAACGGCC A C ATTC AAGGCCGCGCGTA 


I- 


-Seel 


S.cerevisiae 


5' 
3' 


-AGTTACGCTAGGGATAA A CAGGGTAATATAG 
-TCAATGCGATCCC A TATTGTCCC ATTATATC 
5 ' — TAGGGATAA A CAGGGTAAT 

3 ' — ATCCC A TATTGTCCC ATT A ( * Cor e" -S equenz ) 


30 


I- 


-Scell 


S . cerevisiae 


5 ' 
3' 


-AAAACTAAGAAACCAG A TGGGACTTCATAT 


I- 


-Scelll 


S . cerevisiae 


5 ' 
3' 


«.x lVjVanVjUl 1 x x vjj x AAL 1A1 1 J.iil 1ALL 

-TAACCTCCAAAACC A ATTGATAAATAATGG 




I- 


-ScelV 


S . cerevisiae 


5' 
3' 


-TCTTTTCTCTTGATTA A GCCCTAATCTACG 
- AGAAAAGAGAAC A TAATC GGGATT AGATGC 


35 


I- 


-SceV 


S . cerevisiae 


5' 
3' 


— AATAATTTTCT A TC TTAGTAATGCC 
-TTATTAAAAGAAGAATCATTA A CGG 




I- 


-SceVI 


S .cerevisiae 


5' 

3' 


-GTTATTTAATG A TTTTAGTAGTTGG 
-CAATAAATTACAAAATCATCA A ACC 




I- 


-SceVII | 


S.cerevisiae 


5' 


-TGTCACATTGAGGTGCACTAGTTATTAC 


40 


Pl-Scel | 


S . cerevisiae 


5' 
3 ' 


— ATCTATGTCGGGTGC A GGAGAAAGAGGTAAT , 
-TAGATAC AGCC A C ACGCCTCTTTCTCC ATTA 




F- 


-Seel 


S .cerevisiae 


5' 
3' 


- GATGCTGTAGGC A ATAGGCTTGGTT 
-CTACGACA A TCCGTATCCGAACCAA 




F- 


-Scell 


S .cerevisiae 


5' 
3' 


- C TTTCC GCAAC A A GTAAAATT 

- GAAAGGCG A TTGTC ATTTTAA 


45 


I- 


-Hmul 


Bacillus sub- 
tilis bacte- 
riophage SPOl 


5' 
3' 


-AGTAATGAGCCTAACGCTCAGCAA 
-TCATTACTCGGATTGC A GAGTCGTT 
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DSBI-Enzym 


nerKuniLS- 
organismus 


Er kennungs s equ en z 


5 


I-HmuII 


DqC X X 1US 

subtilis 

bac t er i ophage 

SP82 


5 ' -AGTAATGAGCCTAACGCTCAACAANNNNNNNNNNNNNNNNN 
NNNNNNNNNNNNNNNNNNNNNN 




I-Llal 


Lactococcus 
lactis 


5' 
3' 


-CAC ATCCATAAC A C ATATC ATTTTT 
-GTGTAGGTATTGGTATAGTAA^AAA 




I-Msol 


Monomastix 
species 


5' 
3' 


— CTGGGTTC AAAACGTCGTGA'" GAC AGTTTGG 
— GACCCAAGTTTTGCAG CACTCTGTCAAACC 


10 


I-NanI 


Naegleria an- 
dersoni 


5' 
3 ' 


- AAGTCTGGTGCCA^ GC ACCCGC 
— TTCAGACC A ACGGTCGTGGGCG 




I— NitI 


Naegleria 
italica 


5' 
3' 


— AAGTCTGGTGCCA A GC ACCCGC 
-TTCAGACC * ACGGTCGTGGGCG 


15 


I-Njal 


Naegleria ja- 
miesoni 


5' 
3' 


— AAGTCTGGTGCCA^ GC ACCCGC 
-TTCAGACC * ACGGTCGTGGGCG 


I-PakI 


P s eudendo c 1 o - 
nium akinetum 


5' 
3' 


-CTGGGTTC AAAACGTCGTGA^ GACAGTTTGG 
—GACCCAAGTTTTGCAG * CACTCTGTCAAACC 




I-Porl 


Pyrobaculum 
organo tr ophum 


5' 

3' 


-GCGAGCCCGTAAGGGT ~ GTGT ACGGG 
-CGCTCGGGCATT^CCCACACATGCCC 


20 


I-Ppol 


Physarum po- 
ly cephal urn 


5' 
3' 


-TAACTATGACTCTCTTAA * GGTAGCC AAAT 
-ATTGATACTGAGAG^AATTCCATCGGTTTA 




I-Scal 


Sac char omyces 
capensis 


5' 
3' 


— TGTCAC ATTGAGGTGCACT A AGTTATTAC 
- ACAGTGTAACTCC AC A GTGATCAATAATG 




I— Ssp6803I 


Synechocys t i s 
species 


-j 

3' 


VjX^-ValjVj^-. X tnl AtVL.L-V— vjrAA 

— CAGCCCGAGTA^TTGGGCTT 


25 


Pl-Pful 


Pyrococcus 
furiosus Vcl 


^ ' 
3' 


-CTTCTACCCTCC A TCCCTGGCCTGAGTTGAA 




PI-PfuII 


Pyrococcus 
furiosus Vcl 


5' 
3 * 


— ACGAATCC ATGTGGAGA^ AGAGCCTCTATA 

x *jv_ x x*\\j\j X A\»*Av. LlLl 1L X v^(j(jxACjA X AT 


30 


PI~PkoI 


Pyrococcus 
kodakar aens i s 
KOD1 


5' 
3 ' 


-GATTTTAGAT^CCCTGTACC 
-CTAAAA^ TCTAGGGACATGG 




Pl-PkoII 


Pyrococcus 
kodakar aens is 
KOD1 


5' 
3' 


-CAGTACTACG^GTTAC 
-GTCATG^ATGCCAATG 


35 


PI-PspI 


Pyrococcus 
sp. 


5' 
3 ' 


-AAAATCCTGGCaAACAGCTATTAT^GGGTAT 

— T 11 1 u 'pn 1 7\ CZCl i!\PPP r T lr T 1 T 1 P r PPP ArpA 7v 7vrn7vpp/-t7kmA 


PI-Tful 


Thermo coccus 
f umicolans 
ST557 


5' 

3' 


-tagattttaggt^cgctatatccttcc 
-atctaaaa^tccagcgatataggaagg 


40 


PX-TfuII 


Thermo coccus 
f umicolans 
ST557 


5' 
3' 


-TAYGCNGAYACN^GACGGYTTYT 
-ATRCGNCT^RTGNCTGCCRAARA 


PI-Thyl 


Thermococcus 
hydro therma- 
lis 


5' 
3' 


— TAYGCNGAYACN^ GACGGYTTYT 
-ATRCGNCT^RTGNCTGCCRAARA 




PI-Tlil 


Thermococcus 
litoralis 


5' 
3' 


-TAYGCNGAYACNGACGG^ YTTYT 
- ATRCGNCTRTGNC ~ TGCCRAARA 


45 


PI-Tlill 


Thermococcus 
litoralis 


5' 


-AAATTGCTTGCAAACAGCTATTACGGCTAT 




I-TevI 


Bacteriophage 
T4 


5' 
3' 


- AGTGGT ATC AAC A GCTCAGT AGATG 
-TC ACCATAGT A TGCGAGTCATCTAC 
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DSBI-Enzym 


Herkunf ts— 
organ ismus 


Erkennungssequenz 


I-TevII 


Bacteriophage 
T4 


5 ' -GCTTATGAGTATGAAGTGAAGACGT^TATTC 
3 ' -CGAATACTCATACTTCACTTGTG^CAATAAG 


F-TevI 


Bac t er iophage 
T4 


5 ' -GAAACACAAGA^AATGTTTAGTAAANl^^ 
3 ' -CTTTGTGTTCTTTACAAATCATTTNNlSn^ 


F-TevII 


Bacteriophage 
T4 


5 ' -TTTAATCCTCGCTTC ^ AGATATGGCAACTG 
3 ' -AAATTAGGAGCGA^AGTCTATACCGTTGAC 



lo Dabei sind auch kleinere Abweichungen (Degenerationen) der 
Erkennungssequenz umfasst, die dennoch eine Erkennung und 
Spaltung durch das jeweilige DSBI-Enzym ermoglichen. Derartige 
Abweichungen - auch in Zusammenhang mit unterschiedlichen 
Rahmenbedingungen wie beispielsweise Calcium oder Magnesium- 

15 Konzentration - sind beschrieben (Argast GM et al. (1998) J Mol 
Biol 280:345-353), Ferner sind Kernsequenzen ( "Core"-Sequenzen) 
dieser Erkennungssequenzen umfasst. Es ist bekannt, dass auch die 
inneren Anteile der Erkennungssequenzen fur einen induzierten 
Doppelstrangbruch genftgen und das die auSeren nicht unbedingt 

20 relevant sind, jedoch die Effizienz der Spaltung mitbestimmen 
konnen. So kann beispielsweise fur I-Scel eine 
18bp-" Core "-Sequenz definiert werden. 



Besagte DSBI-Erkennungssequenzen konnen an verschiedenen 
25 Positionen in oder in der Nahe eines Markerprotein-Gens lokali- 
siert werden und konnen - beispielsweise bei der Verwendung eines 
Transgens als Markerproteins - bereits bei der Konstruktion der 
Markerprotein-Expressionskassette eingebaut werden. Verschiedene 
M6glichkeiten der Lokalisation sind beispielhaft in den Fig. 2 -A, 
30 2-B, 3 und 5 sowie in den Beschreibungen dazu verdeutlicht . 

In einer weiteren vorteilhaf ten Ausfuhrungsf orm -umfasst die 
Insertionsseguenz mindestens eine Homologiesequenz A, die eine 
ausreichende Lange und eine ausreichende Homologie zu einer 

35 Sequenz A' in dem Markerproteingen aufweist, urn eine homologe 
Rekombination zwischen A und A 7 zu gewahrleisten. Bevorzugt 
ist Insertionssequenz von zwei Sequenzen A und B flankiert, die 
eine ausreichende Lange und eine ausreichende Homologie zu einer 
Sequenz A' bzw. B' in dem Markerproteingen aufweisen, urn eine 

40 homologe Rekombination zwischen A und A' bzw. B und B' zu gewahr- 
leisten. 



"Ausreichende Lange" meint in Bezug auf die Homologiesequenzen A, 
A' und B, B' bevorzugt Sequenzen von einer Lange von mindestens 
45 100 Basenpaaren, bevorzugt mindestens 250 Basenpaaren, besonders 
bevorzugt von mindestens 500 Basenpaaren, ganz besonders bevor- 
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zugt von mindestens 1000 Basenpaaren, am meistens bevorzugt von 
mindestens 2500 Basenpaaren. 

"Ausreichende Homologie" meint in Bezug auf die Homologie- 
5 sequenzen, bevorzugt Sequenzen die eine Homologie zueinander 
aufweisen von mindestens 70 %, bevorzugt 80 %, vorzugsweise min- 
destens 90 %, besonders bevorzugt mindestens 95 %, ganz besonders 
bevorzugt mindestens 99 %, am meisten bevorzugt 100% iiber eine 
Lange von von mindestens 20 Basenpaaren, bevorzugt mindestens 
10 50 Basenpaaren, besonders bevorzugt von mindestens 100 Basen- 
paaren, ganz besonders bevorzugt von mindestens 250 Basenpaaren, 
am meisten bevorzugt von mindestens 500 Basenpaaren. 

Unter Homologie zwischen zwei Nukleinsauren wird die Identitat 
15 der Nukleinsauresequenz iiber die jeweils gesamte Sequenz lange 

verstanden, die durch Vergleich mit Hilfe des Programmalgorithmus 
GAP (Wisconsin Package Version 10.0, University of Wisconsin, 
Genetics Computer Group (GCG) , Madison, USA) unter Einstellung 
folgender Parameter berechnet wird: 



25 In einer weiteren bevorzugten Ausf uhrungsf orm wird die Effizienz 
der Rekombination gesteigert durch Kombination mit Verfahren, 
die die homologe Rekombination fordern. Solche Verfahren sind be- 
schrieben und umfassen beispielhaft die Expression von Proteinen 
wie RecA oder die Behandlung mit PARP- Inhibit or en. Es konnte 

30 gezeigt werden, dass die intrachromosomale homologe Rekombination 
in Tabakpf lanzen durch die Verwendung von PARP-Inhibitoren erhoht 
werden kann (Puchta H et al . (1995) Plant J 7:203-210). Durch 
den Einsatz dieser Inhibitoren kann die Rate der homologen 
Rekombination in den Rekombinationskonstrukten nach Induktion 

35 des secjuenzspezif ischen DNA-Doppelstrangbruches -and damit die 
Effizienz der Deletion der Transgensequenzen weiter erhoht 
werden. Verschiedene PARP Inhibitoren konnen dabei zum Einsatz 
kommen. Bevorzugt umfasst sind Inhibitoren wie 3-Aminobenzamid, 
8-Hydroxy-2-methylquinazolin-4-on (NU1025 ) , 1 , llb-Dihydro- 

40 [2H]benzopyrano[4,3,2-de]isoquinolin-3-on (GPI 6150), 5-Amino- 
isoquinolinon, 3 , 4-Dihydro-5- [4- (l-piperidinyl)butoxy] -1 (2H) - 
isoquinolinon oder die in WO 00/26192, WO 00/29384, WO 00/32579, 
WO 00/64878, WO 00/68206, WO 00/67734, WO 01/23386 und 
WO 01/23390 beschriebenen Substanzen. 

45 

Weitere geeignete Methoden sind die Einfiihrung von Nonsense- 
Mutationen in endogene Markerprotein Gene zum Beispiel mittels 



20 



Gap Weight: 12 



Length Weight: 4 



Average Match: 2,912 



Average Mismatch: -2 , 003 
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Einfiihrung von RNA/DNA-Oligonukleotiden in die Pflanze (Zhu 
et al. (2000) Nat Biotechnol 18 (5) : 555-558) . Punktmutationen 
konnen auch mittels DNA-RNA Hybriden erzeugt werden, die auch 
als "chimeraplasty" bekannt sind (Cole-Strauss et al . (1999) Nucl 
Acids Res 27 ( 5 ): 1323-1330 ; Kmiec (1999) Gene therapy American 
Scientist 87 (3) : 240-247) . 

Die Methoden der dsRNAi, der Kosuppression mittels sense-RNA 
und der "VIGS" (''virus induced gene silencing") werden auch als 
"post-transcriptional gene silencing" (PTGS) bezeichnet. PTGS- 
Verfahren sind besonders vorteilhaft, weil die Anf orderungen an 
die Homologie zwischen dem zu vermindernden Markerprotein-Gen und 
der transgen exprimierten sense- oder dsRNA-Nukleinsauresequenz 
geringer sind als beispielsweise bei einem klassischen antisense- 
15 Ansatz. So kann man unter Verwendung der Markerprotein-Nuklein- 
sauresequenzen aus einer Art auch die Expression von homologen 
Markerprotein-Proteinen in anderen Arten effektiv vermindern, 
ohne, dass die Isolierung und Strukturauf klarung der dort vor- 
kommenden Markerprotein-Homologen zwingend erforderlich ware. 
20 Dies erleichtert erheblich den Arbeitsaufwand. 

"Einbringen" umfasst im Rahmen der Erfindung alle Verfahren, die 
dazu geeignet eine "anti-Markerprotein''~Verbindung, direkt oder 
indirekt, in eine Pflanze oder eine Zelle, Kompartiment , Gewebe, 

25 Organ oder Samen derselben . einzuf uhren oder dort zu generieren. 
Direkte und indirekte Verfahren sind umfasst. Das Einbringen 
kann zu einer voriibergehenden (transienten) Prasenz einer 
"anti-Markerprotein"-Verbindung (beispielsweise einer dsRNA 
oder einer Rekombinase) fuhren oder aber auch zu einer dauer- 

30 haften (stabilen) . 

Gemafc der unterschiedlichen Natur der oben beschriebenen Ansatze 
kann die »anti-Markerprotein''-Verbindung ihre Funktion direkt 
(zum Beispiel durch Insertion in ein endogenes Markerprotein Gen) 

35 ausiiben. Die Funktion kann aber auch indirekt nach Transkription 
in eine RNA (zum Beispiel bei antisense Ansatzen) oder nach 
Transkription und Translation in ein Protein (zum Beispiel bei 
Rekombinasen oder DSBI-Enzymen) ausgeubt werden. Sowohl direkte 
als auch indirekt wirkende "anti-Markerprotein''-Verbindungen 

40 sind erf indungsgem&S umfasst . 

Einfiihren umfasst beispielsweise Verfahren wie Transf ektion, 
Transduktion oder Transformation. 

45 u Anti-Markerprotein" Verbindungen umfasst somit beispiels- 
weise auch Expressionskassetten, die eine' Expression (d.h. 
Transkription und ggf . Translation) beispielsweise einer 
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MP-dsRNA , einer MP-antisenseRNA, einer sequenzspezif ischen 
Rekombinase oder eines DSBI-Enzyms in einer pflanzlichen Zelle 
realisieren konnen. 

5 "Expressionskassette" meint im Rahmen dieser Erfindung allgemein 
solche Konstruktionen in denen eine zu exprimierende Nuklein- 
sauresequenz in funktioneller Verknupfung mit mindestens einer 
genetischen Kontrollsequenz - bevorzugt einer Promotorsequenz - 
steht. Expressionskassetten bestehen bevorzugt aus doppel- 
10 strangiger DNA und konnen eine lineare oder zirkulare Struktur 
haben . 

Unter einer funktionellen Verknupfung versteht man zum Bei- 
spiel die sequentielle Anordnung eines Promoters mit einer zu 

IS transkribierenden Nukleinsauresequenz (beispielsweise kodierend 
fur eines MP-dsRNA oder ein DSBI-Enzym) und ggf . weiterer regu- 
lativer Elemente wie zum Beispiel einem Terminator und/oder Poly- 
adenylierungssignalen derart, dass jedes der regulativen Elemente 
seine Funktion bei der Transkription der Nukleinsauresequenz, je 

20 nach Anordnung der Nukleinsauresequenzen erfxillen kann. Funktion 
kann dabei beispielsweise die Kontrolle der Expression d.h. 
Transkription und/oder Translation der Nukleinsauresequenz (bei- 
spielsweise kodierend ftir eine MP-dsRNA oder ein DSBI-Enzym) 
bedeuten. Kontrolle umfasst dabei beispielsweise das Initiieren, 

25 Steigerung, Steuerung oder Suppression der Expression d.h. Tran- 
skription und ggf. Translation. Dazu ist nicht unbedingt eine 
direkte Verknupfung im chemischen Sinne erf orderlich. Genetische 
Kontrollsequenzen, wie zum Beispiel Enhancer-Sequenzen, konnen 
ihre Funktion auch von weiter entfernten Positionen oder gar von 

30 anderen DNA-Molekulen aus auf die Zielsequenz ausiiben. Bevorzugt 
sind Anordnungen, in denen die zu transkribierende Nukleinsaure- 
sequenz hinter der als Promoter fungierenden Sequenz positioniert 
wird, so dass beide Sequenzen kovalent miteinander verbunden 
sind. Bevorzugt ist dabei der Abstand zwischen der Promotorse- 
35 quenz und der transgen zu exprimierende Nukleinsauresequenz 
geringer als 200 Basenpaare, besonders bevorzugt kleiner als 
100 Basenpaare, ganz besonders bevorzugt kleiner als 50 Basen- 
paare . 

40 Dem Fachmann sind verschiedene Wege bekannt, urn zu einer der 
erf indungsgemassen Expressionskassette zu gelangen. Die Her- 
stellung einer erf indungsgemassen Expressionskassette erfolgt 
beispielsweise bevorzugt durch direkte Fusion einer als Promoter 
fungierenden Nukleinsauresequenz mit einer zu exprimierenden 

45 Nukleotidsequenz (beispielsweise kodierend fur eines MP-dsRNA 
oder ein DSBI-Enzym) . Die Herstellung einer funktionellen Ver- 
knupfung kann mittels g&ngiger Rekombinations- und Klonierungs- 
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techniken realisiert werden, wie sie beispielsweise in Maniatis 
T, Fritsch EF und Sanibrook J (1989) Molecular Cloning: A Labora- 
tory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, 
NY sowie in Silhavy TJ et al. (1984) Experiments with Gene 
5 Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY 
und in Ausubel FM et al.(1987) Current Protocols in Molecular 
Biology, Greene Publishing Assoc. and Wiley Interscience 
beschrieben sind. 

10 Vorzugsweise umfassen die erf indungsgemassen Expressionskassetten 
5 '-stromaufwarts von der jeweiligen transgen zu exprimierenden 
Nukleinsauresequenz einen Promotor und 3 ' -stromabwarts eine Ter- 
minatorsequenz als zusatzliche genetische Kontrollsequenz, sowie 
gegebenenfalls weitere iibliche regulative Elemente, und zwar 

15 jeweils funktionell verknupft mit der transgen zu exprimierenden 
Nukleinsauresequenz . 

Der Begrif f der "genetischen Kontrollsequenzen" ist breit zu 
verstehen und meint all solche Sequenzen, die einen Einfluss 

20 auf das Zustandekommen oder die Funktion der erf indungsgemassen 
Expressionskassette haben. Genetische Kontrollsequenzen gewahr- 
leisten zum Beispiel die Transkription und gegebenenfalls 
Translation in prokaryotischen oder eukaryotischen Organismen. 
Genetische Kontrollsequenzen sind beispielsweise beschrieben bei 

25 "Goeddel; Gene Expression Technology: Methods in Enzymology 185, 
Academic Press, San Diego, CA (1990)" oder "Gruber and Crosby, 
in: Methods in Plant Molecular Biology and Biotechnolgy, CRC 
Press, Boca Raton, Florida, eds.:Glick and Thompson, Chapter 7, 
89-108" sowie den dort auf gewiesenen Zitaten. 



Genetische Kontrollsequenzen umfassen insbesondere in Pflanzen 
funktionelle Promotoren. Als bevorzugte Promotoren fur die 
Expressionskassetten ist grundsatzlich jeder Promotor geeignet, 
der die Expression voh Genen, insbesondere Fremdgenen, in 
35 Pflanzen steuern kann. 

Pf lanzenspezif ische oder in Pflanzen bzw. pflanzlichen Zelle 
funktionelle Promotoren meint grundsatzlich jeden Promotor, der 
die Expression von Genen, insbesondere Fremdgenen, in mindestens 
40 einer Pflanze oder einem Pf lanzenteil , -zelle, -gewebe, -kultur 
steuern kann. Dabei kann die Expression beispielsweise konstitu- 
tiv, induzierbar oder entwicklungsabhangig sein. Bevorzugt sind: 



30 
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a) Konstitutive Promotoren 

"Konstitutive" Promotoren meint solche Promotoren, die eine 
Expression in zahlreichen, bevorzugt alien, Geweben tiber 
einen groSeren Zeitraum der Pf lanzenentwicklung, bevorzugt 
zu alien Zeitpunkten der Pf lanzenentwicklung, gewahrleisten 
(Benfey et al.(1989) EMBO J 8:2195-2202). Vorzugsweise 
verwendet man insbesondere einen pf lanzlichen Promotor oder 
einen Promotor, der einem Pf lanzenvirus entstammt. Ins- 
besondere bevorzugt ist der Promotor des 35S-Transkriptes 
des CaMV Blumenkohlmosaikvirus (Franck et al. (1980) Cell 
21:285-294; Odell et al . (1985) Nature 313:810-812; Shewmaker 
et al. (1985) Virology 140:281-288; Gardner et al . (1986) 
Plant Mol Biol 6:221- 228) oder der 19S CaMV Promotor 
15 (US 5,352,605; WO 84/02913; Benfey et al . (1989) EMBO J 

8:2195-2202) sowie der Promotor des Nitrilase-1 Gens aus 
Arabidopsis thaliana (GenBank Acc.-No. : Y07648, Nukleotide 
2456 (alternativ 2861) bis 4308 oder alternativ 4340 oder 
4344. (beispielsweise bp 2456 bis 4340). 

20 

Ein weiterer geeigneter konstitutiver Promotor ist der 
"Rubisco small subunit (SSU) "-Promotor (US 4,962,028), der 
LeguminB-Promotor (GenBank Acc.-No.: X03677), der Promotor 
der Nopalinsynthase aus Agrobacterium, der TR-Doppelpromotor , 

25 der OCS (Octopin Synthase) Promotor aus Agrobacterium, der 

Ubiquitin Promotor (Holtorf S et al . (1995) Plant Mol Biol 
29:637-649), der Ubiquitin 1 Promotor (Christensen et al . 
(1992) Plant Mol Biol 18:675-689; Bruce et al. (1989) Proc 
Natl Acad Sci USA 86:9692-9696), der Smas Promotor, der 

30 Cinnamylalkoholdehydrogenase-Promotor (US 5 , 683 , 439 ) , 

die Promotoren der vakuolarer ATPase Untereinheiten oder 
der Promotor eines prolinreichen Proteins aus Weizen 
(WO 91/13991) , sowie weitere Promotoren von Genen, deren 
konstitutive Expression in Pflanzen dem Fachmann bekannt ist. 



35 



b) Gewebespezif ische Promotoren 

Bevorzugt sind Promotoren mit Spezifitaten fur die Anther en, 
Ovarien, Bliiten, Blatter, Stengel, Wurzeln oder Samen. 



40 



Samenspezif ische Promotoren umfassen zum Beispiel den 
Promotor des Phaseolins (US 5,504,200; Bustos MM et al . 
(1989) Plant Cell 1 (9) : 839-53) , des 2S Albumins (Joseff- 
son LG et al . (1987) J Biol Chem 262:12196-12201), des 
45 Legumins (Sbirsat A et al . (1989) Mol Gen Genet 215(2): 

326-331)/ des USP (unknown seed protein; Baumlein H 
et al. (1991) Mol Gen Genet 225 (3 ): 459-67 ) , des Napins 
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(US 5,608,152; Stalberg K et al. (1996) L Planta 
199:515-519)* des Saccharosebindeproteins (WO 00/26388), 
des Legumins B4 (LeB4 ; Baumlein H et al, (1991) Mol Gen 
Genet 225: 121-128; Baeumlein et al. (1992) Plant Journal 
2(2):233-9; Fiedler U et al . (1995) Biotechnology (NY) 
13 (10) :1090f ) , des Oleosins (WO 98/45461) oder des Bce4 
(WO 91/13980) . Weitere geeignete samenspezif ische 
Promotoren sind die der Gene kodierend fur das "High 
Molecular Weight Glutenin" (HMWG) , Gliadin, Verzweigungs- 
enzym, ADP Glucose Pyrophosphatase (AGPase) oder Starke- 
synthase. Bevorzugt sind ferner Promotoren, die eine 
samenspezif ische Expression in Monokotyledonen wie Mais, 
Gerste, Weizen, Roggen, Reis etc. erlauben. Vorteilhaft 
eingesetzt werden konnen der Promoter des lpt2- oder 
lptl-Gens (WO 95/15389, WO 95/23230) oder die Promotoren 
beschrieben in WO 99/16890 (Promotoren des Hordeins, 
Glutelins, Oryzins, Prolamins, Gliadins, Zeins, Kasirins 
oder Secalins) . Weitere samenspezif ische Promotoren sind 
beschrieben in WO 89/03887. 

Knollen-, Speicherwurzel- oder Wurzel-spezif ische Promo- 
toren umfassen beispielsweise den Patatin Promotor Klasse 
I (B33) oder den Promotor des Cathepsin D Inhibitors aus 
Kartoffel. 

Blattspezif ische Promotoren umfassen beispielsweise 
den Promotor der cytosolischen FBPase aus Kartoffel 
(WO 97/05900), den SSU Promotor (small subunit) der 
Rubisco (Ribulose-1, 5-bisphosphatcarboxylase) oder den 
ST-LSI Promotor aus Kartoffel (Stockhaus et al. (1989) 
EMBO J 8:2445-2451). 

Bltitenspezif ische Promotoren umfassen beispielsweise den 
Phytoen Synthase Promotor (WO 92/16635) oder den Promotor 
des P-rr Gens (WO 98/22593). 

Anther en-spez if ische Promotoren umfassen beispielsweise 
den 5126-Promotor (US 5,689,049, US 5,689,051), den 
glob-1 Promotor und den y-Zein Promotor. 

c) Chemisch induzierbare Promotoren 

Chemisch induzierbare Promotor erlauben es, die Expression 
abhangig von einem exogenen Stimulus zu steuern (Ubersichts- 
artikel: Gatz et al . (1997) Ann Rev Plant Physiol Plant 
Mol Biol 48:89-108). Beispielhaft seien zu nennen: Der PRPl 
Promotor (Ward et al . (1993) Plant Mol Biol 22:361-366), 
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ein durch Salicylsaure induzierbarer Promotor (WO 95/19443), 
ein durch Benzolsulf onamid-induzierbarer Promotor 
(EP-A 0 388 186), ein durch Tetrazyklin- induzierbarer 
Promotor (Gatz et al . (1992) Plant J 2:397-404), ein durch 
5 Abscisinsaure induzierbarer Promotor (EP 0 335 528) bzw. 

ein durch Ethanol- oder Cyclohexanon- induzierbarer Promotor 
(WO 93/21334) . Ferner geeignet ist der Promotor des Gluta- 
thione-S-transf erase Isoform II Gens (GST-II-27) , der 
durch exogen applizierte Safener wie z.B. N,N-Diallyl- 
10 2, 2-dichloroacetamid aktiviert werden kann (W0 93/01294) 

und in zahlreichen Geweben von sowohl Monokotyledonen als 
auch Dikotyledonen f unktionell ist . 

Besonders bevorzugt sind konstitutive oder induzierbare 
15 Promotoren. 

Ferner sind far die gezielte Expression in den Plastiden 
plastiden-spezif ische Promotoren bevorzugt. Geeignete Promotoren 
sind beispielsweise beschrieben in WO 98/55595 oder WO 97/06250. 
20 Zu nennen sind das rpo B Promotorelement, das atoB Promotor- 
element, das clpP Promotorelement (siehe auch WO 99/46394) oder 
das 16SrDNA Promotorelement. Weiterhin sind virale Promotoren 
geeignet (WO 95/16783). 

25 Eine gezielte plastidare Expression kann auch erreicht werden, 
wenn man zum Beispiel einen bakteriellen oder Bakteriophagen 
Promotor verwendet, die resultierende Expressionskassette in 
die plastidare DNA einbringt und die Expression dann durch ein 
Fusionsprotein aus einer bakteriellen oder Bakteriophagen Poly- 

30 merase und einem plastidaren Transitpeptid exprimiert. Ein ent- 
sprechendes Verfahren ist in US 5,925,806 beschrieben. 

Genetische Kontrollsequenzen umfassen ferner auch die 5'-untrans- 
latierte Regionen, Introns oder nichtkodierende 3 ' -Region von 

35 Genen wie beispielsweise das Actin-1 Intron, oder die Adhl-S 
Introns 1, 2 und 6 (allgemein: The Maize Handbook, Chapter 116, 
Freeling and Walbot, Eds., Springer, New York (1994)). Es ist 
gezeigt worden, dass diese eine signifikante Funktionen bei der 
Regulation der Genexpression spielen konnen. So wurde gezeigt, 

40 dass 5 ' -untranslatierte Sequenzen die transiente Expression 

heterologer Gene verstarken konnen. Sie konnen ferner die Gewebs- 
spezifitat fordern (Rouster J et al.(1998) Plant J. 15:435-440). 
Beispielhaft fur Translationsverstarker sei die 5 ' -Leadersequenz 
aus dem Tabak-Mosaik-Virus zu nennen (Gallie et al . (1987) Nucl 

45 Acids Res 15:8693-8711). 
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Als Kontrollsequenzen geeignete Polyadenylierungssignale sind 
insbesondere Polyadenylierungssignale pflanzlicher Gene sowie 
T-DNA Polyadenylierungssignale aus Agrobacterium tumefaclens. 
Beispiele fur besonders geeignete Terminatorsequenzen sind 
5 der OCS (Octopin- Synthase) -Terminator und der NOS (Nopalin- 
Synthase) -Terminator (Depicker A et al (1982) J Mol Appl Genet 
1:561-573), als auch die Tentiinatoren von Sojabohnen Actin, 
RUBISCO oder alpha-Amylase aus Weizen (Baulcombe DC et al (1987) 
Mol Gen Genet 209:33-40) . 

10 

Die Expressionskassette kann vorteilhaf terweise eine oder mehrere 
sogenannte "enhancer Sequenzen" funktionell verkniipft mit dem 
Promoter enthalten, die eine erhohte transgene Expression der 
Nukleinsauresequenz ermoglichen . 

15 

Genetische Kontrollsequenzen meint ferner Sequenzen, die fur 
Fusionsproteine bestehend aus einer Signalpeptidsequenz kodieren. 
Die Expression eines Zielgenes ist in jedem gewiinschten Zell- 
kompartiment , wie z.B. dem Endomembransystem, der Vakuole und 

20 den Chloroplasten moglich. Durch Nutzung des sekretorischen Weges 
sind gewiinschte Glykosylierungsreaktionen, besondere Faltungen 
u.a. moglich. Auch die Sekretion des Zielproteins zur Zellober- 
flache bzw. die Sezernierung ins Kulturmedium, beispielsweise 
bei Nutzung suspensionskultivierter Zellen oder Protoplasten ist 

25 moglich. Die dafur notwendigen Targetsequenzen konnen sowohl in 
einzelnen Vektorvariationen berticksichtigt werden als auch durch 
Verwendung einer geeigneten Klonierungsstrategie gemeinsam mit 
dem zu klonierenden Zielgen in den Vektor mit eingebracht werden. 
Als Targetsequenzen konnen sowohl Gen-eigene, sofern vorhanden, 

30 oder heterologe Sequenzen genutzt werden. Zusatzliche, hetero- 
loge zur funktionellen Verknupfung bevorzugte aber nicht darauf 
beschrankte Sequenzen sind weitere Targeting-Sequenzen zur 
Gewahr lei stung der subzellularen Lokalisation im Apoplasten, 
in der Vakuole, in Plastiden, im Mitochondrium, im Endoplas- 

35 matischen Retikulum (ER) , im Zellkern, in Olkorperchen oder 
anderen Kompartimenten; sowie Translationsverstarker wie die 
5 ' -Leadersequenz aus dem Tabak-Mosaik-Virus (Gallie et al . (1987) 
Nucl Acids Res 15: 8693-8711) und dergleichen. Das Verfahren, 
an sich nicht in den Plastiden lokalisierte Proteine, gezielt 

40 in die Plastiden zu transport ier en ist beschrieben (Klosgen RB 
und Weil JH (1991) Mol Gen Genet 225 (2) :297-304; Van Breusegem 
F et al. (1998) Plant Mol Biol 38 ( 3 ): 491-496 ) . 

Als Kontrollsequenzen sind weiterhin solche zu verstehen, die 
45 eine homologe Rekombination bzw. Insertion in das Genom eines 
Wirtsorganismus ermoglichen oder die Entfernung aus dem Genom 
erlauben. Methoden wie die cre/lox-Technologie erlauben eine 
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gewebsspezif ische, unter Umst&nden induzierbare Entfernung der 
Expressionskassette aus dem Genom des Wirtsorganismus (Sauer B. 
Methods. 1998; 14 (4) : 381-92) . Hier werden bestiramte flankierende 
Sequenzen dem Zielgen angefugt (lox-Sequenzen) , die spater eine 
5 Entfernung mittels der cre-Rekombinase ermoglichen. 

Bevorzugt kann die Expressionskassette, bestehend aus einer 
Verkmipfung von Promoter und zu transkribierender Nukleinsaure- 
sequenz, integriert in einem Vektor vorliegen und durch zum Bei- 
10 spiel Transformation - nach einem der unten beschriebenen Ver- 
fahren - in die pflanzliche Zelle oder Organismus eingebracht 
werden . 

"Transgen" meint bevorzugt - beispielsweise in Bezug auf eine 
15 transgene Expressionskassette, einen transgenen Expressions - 

vektor, einen transgenen Organismus oder Verfahren zur transgenen 
Expression von Nukleinsauren - alle solche durch gentechnische 
Methoden zustande gekommene Konstruktionen oder Verfahren unter 
Verwendung derselben, in denen entweder 



20 



25 



a) die zu exprimierende Nukleinsiauresequenz , oder 

b) der mit der zu exprimierenden Nukleinsauresequenz gemaJS a) 
funktionell verkmipfte Promotor, oder 

c) (a) und (b) 



sich nicht in ihrer naturlichen, genetischen Umgebung (d.h. an 
ihrem naturlichen chromosomalen Locus) befinden oder durch gen- 

30 technische Methoden modifiziert wurden, wobei die Modifikation 
beispielhaft eine Substitution, Addition, Deletion, Inversion 
oder Insertion eines oder mehrerer Nukleotidreste sein kann. 
Naturliche genetische Umgebung meint den naturlichen chromo- 
somalen Locus in dem Herkunf tsorganismus oder das Vorliegen 

35 in einer genomischen Bibliothek. 

"Transgen" meint in Bezug auf eine Expression ("transgene 
Expression") bevorzugt all solche unter Einsatz einer transgenen 
Expressionskassette, transgenen Express ionsvektor oder transgenen 
40 Organismus - entsprechend dem oben gegebenen Definitionen - 
realisierten Expressionen. 

Die im Rahmen des erf indungsgemassen Verfahren zum Einsatz 
kommenden DNA-Konstrukte und die von ihnen abgeleiteten 
45 Vektoren konnen weitere Funktionselemente enthalten. Der 

Begrif f Funktionselement ist breit zu verstehen und meint all 
solche Elemente, die einen Einfluss auf Herstellung, Vermehrung 
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oder Funktion der DNA-Konstrukte oder von diesen abgeleitete 
Vektoren oder Organismen haben. Beispielhaft aber nicht ein- 
schrankend seien zu nennen: 

5 1 . Selektionsmarker 

Selektionsmarker umfassen beispielsweise solche Nukleinsaure- 
oder Proteinsequenzen, deren Expression einer Zelle, Gewebe oder 
Organismus einen Vorteil (positiver Selektionsmarker) oder Nach- 

10 teil (negativer Selektionsmarker) gegenuber Zellen vermittelt, 
die diese Nukleinsaure oder Protein nicht exprimieren. Positive 
Selektionsmarker wirken beispielsweise dadurch, dass eine auf 
die Zelle inhibitorisch wirkende Substanz detoxif iziert wird 
(Bsp. Antibiotika-/Herbizidresistenz) , oder eine Substanz 

15 gebildet wird, welche der Pflanze unter den gewahlten Bedingungen 
verbesserte Regeneration oder erhohtes Wachstum ermoglicht 
(zum Beispiel nutritive Marker, hormonproduzierender Marker wie 
ipt; s.u.). Eine andere Form positiver Selektionsmarker umfasst 
mutierte Proteine oder RNAs, die gegenuber einem selektiven Agenz 

20 nicht empfindlich sind (beispielsweise 16S rRNA Mutanten, die 

unempfindlich gegenuber Spectinomycin sind) . Negative Selektions- 
marker wirken beispielsweise dadurch, dass sie die Bildung einer 
toxischen Substanz in den trans formier ten Zellen katalysieren 
(zum Beispiel das codA Gen) . 

25 

1.1 Positive Selektionsmarker: 

Die DNA-Konstrukte konnen zur weiteren Steigerung der Effizienz 
zusatzliche positive Selektionsmarker umfassen. In einer bevor- 

30 zugten Ausfiihrungsf orm kann so das erf indungsgemaSe Verfahren 
im Form einer doppelten Selektion realisiert werden, wobei 
zusammen mit der zu insertierenden Nukleinsauresequenz ein 
Sequenz kodierend fur eine Resistenz gegen mindestens ein Toxin, 
Antibiotikum oder Herbizid eingebracht wird, und die Selektion 

35 zusatzlich unter Einsatz des Toxins, Antibiotikums oder Herbizids 
erf olgt . 

Entsprechende Proteine und Sequenzen von positiven Selektions- 
markern sowie Selektionsverf ahren sind dem Fachmann gelauf ig . Der 

40 Selektionsmarker verleiht den erfolgreich transf ormierten Zellen 
eine Resistenz gegen ein Biozid (zum Beispiel ein Herbizid wie 
Phosphinothricin, Glyphosat oder Bromoxynil) , einen Metabolismus- 
inhibitor wie 2-Desoxyglucose-6-phosphat (WO 98/45456) oder ein 
Antibiotikum, wie zum Beispiel Tetracycline, Ampicillin, Kana- 

45 mycin, G 418, Neomycin, Bleomycin oder Hygromycin. Beispielhaft 
als Selektionsmarker seien genannt : 
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Phosphinothricinacetyltransferasen (PAT) , welche die freie 
Aminogruppe des Glutaminsynthaseinhibitors Phosphinothricin 
(PPT) acetylieren und damit eine Detoxif izierung des PPT 
erreichen (de Block et al. (1987) EMBO J 6:2513-2518) (auch 
Bialophos® Resistenzgen (bar) genannt) . Entsprechende 
Sequenzen sind dem Fachmann bekannt (aus Streptomyces hygro- 
scopicus GenBank Acc.-No.: X17220 und X05822, aus Strepto- 
myces viridochromogenes GenBank Acc.-No.: M 22827 und X65195; 
US 5,489,520). Ferner sind synthetische Gene fur die 
Expression in Plastiden beschrieben. Ein synthetisches 
PAT-Gen ist beschrieben in Becker et al . (1994) Plant J 
5 ; 299-307. Die Gene verleihen Resistenz gegen das Herbizid 
Bialaphos oder Glufosinat und sind vielbenutzer Marker in 
transgenen Pflanzen (Vickers JE et al. (1996) Plant Mol 
Miol Reporter 14:3 63-368; Thompson CJ et al. (1987) EMBO J 
6:2519-2523) . 

5-Enolpyruvylshikimat-3-phosphatsynthasen (EPSPS) , die eine 
Resistenz gegen Glyphosat (N- (phosphonomethyl) glycin) ver- 
leihen. Das unselektive Herbizid Glyphosat hat die 5-Enol- 
pyruvyl-3-phosphoshikimat synthase (EPSPS) als molekulares 
Target. Diese hat eine Schliisselfunktion in der Biosynthese 
aromatischer Aminosauren in Mikroben und Pflanzen, jedoch 
nicht in Saugern (Steinrucken HC et al. (1980) Biochem Bio- 
phys Res Commun 94:1207-1212; Levin JG und. Sprinson DB 
(1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode of 
action of glyphosate a literature analysis, p. 48-74. In: 
Grossbard E und Atkinson D (eds.). The herbicide glyphosate. 
Buttersworths , Boston.). Glyphosat-tolerante EPSPS Varianten 
werden bevorzugt als Selektionsmarker verwendet (Padgette SR 
et al. (1996). New weed control opportunities: development of 
soybeans with a Roundup Ready™ gene. In: Herbicide Resistant 
Crops (Duke, S.O., ed.), pp. 53-84. CRC Press, Boca Raton, 
FL; Saroha MK und Malik VS (1998) J Plant Biochemistry and 
Biotechnology 7:65-72) . Das EPSPS Gen des Agrobakterium sp. 
strain CP4 hat eine natxirliche Toleranz gegen Glyphosat, 
die auf entsprechende transgene Pflanzen transferiert 
werden kann. Das CP4 EPSPS Gen wurde aus Agrobakterium sp. 
strain CP4 kloniert (Padgette SR et al. (199 5) Crop Science 
35(5) : 1451-1461) . Sequenzen von EPSPS-Enzymen, die Glyphosat- 
tolerant sind, sind beschrieben (u.a. in US 5,510,471; 
US 5,776,760; US 5,864,425; US 5,633,435; US 5,627;061; 
US 5,463,175; EP 0 218 571). Weitere Sequenzen sind 
beschrieben unter GenBank Acc.-No: X63374 oder M10947. 
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Glyphosat® degradierende Enzyme (gox Gen; Glyphosatoxido- 
reduktase) . GOX (beispielsweise die Glyphosatoxidoreductase 
aus Achromobacter sp.) katalysiert die Spaltung einer C-N 
Bindung im Glyphosat, welches so zu Aminomethylphosphonsaure 
(AMPA) und Glyoxylat umgesetzt wird. GOX kann dadurch eine 
Resistenz gegen Glyphosat vermitteln (Padgette SR et al . 
(1996) J Nutr 126 (3) :702-16; Shah D et al . (1986) Science 
233:478-481) . 

Das deh Gen kodiert fur eine Dehalogenase, die Dalapon® 
inaktiviert (GenBank Acc.-No.: AX022822, AX022820 sowie 
WO 99/27116) 

Die bxn Gene kodieren fur Bromoxynil degradierende Nitrilase- 
enzyme (Genbank Acc.-No: E01313 und J03196) . 

Neomycinphosphotransf erasen verleihen eine Resistenz 
gegen Antibiotika (Aminoglykoside) wie Neomycin, G418, 
Hygromycin, Paromomycin oder Kanamycin, indem sie 
durch eine Phosphorylierungsreaktion deren inhibierende 
Wirkung reduzieren. Besonders bevorzugt ist das nptll Gen. 
Sequenzen konnen aus der GenBank erhalten werden (AF080390; 
AF080389) . Zudem ist das Gen bereits Bestandteil zahlreicher 
Expressionsvektoren und kann unter Verwendung von dem 
Fachmann gelaufigen Verfahren aus diesen isoliert werden 

(AF234316; AF234315; AF234314) . Das NPTII Gen kodiert fur 
eine Aminoglycosid-3 ' O-phosphotransf erase aus E.coli, Tn5 

(GenBank Acc.-No: U00004 Position 1401-2300; Beck et al . 

(1982) Gene 19 327-336). 

Das D0G R 1-Gen wurde aus der Hefe Saccharomyces cerevisiae 
isoliert (EP-A 0 807 836) und kodiert fur eine 2-Desoxy- 
glukose-6-phosphat Phosphatase, die eine Resistenz gegenuber 
2-DOG verleiht (Randez-Gil et al. (1995) Yeast 11:1233-1240; 
Sanz et al . (1994) Yeast 10:1195-1202, GenBank Acc.-No.: 
NC001140; Position 194799-194056). 

Acetolactatsynthasen, die eine Resistenz gegen Imidazolinon/ 
Sulfonylurea-Herbizide verleihen (GenBank Acc-No. : X51514; 
Sathasivan K et al. (1990) Nucleic Acids Res. 18(8):2188); 
AB049823; AF094326; X07645; X07644; A19547; A19546; A19545; 
105376; 105373; AL133315) 

Hygromycinphosphotransf erasen (z.B. GenBank Acc-No.: X74325) 
die eine Resistenz gegen das Antibiotikum Hygromycin ver- 
leihen. Das Gen ist Bestandteil zahlreicher Expressions- 
vektoren und kann unter Verwendung von dem Fachmann 
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gelaufigen Verfahren (wie beispielsweise Polymeraseketten- 
reaktion) aus diesen isoliert werden (GenBank Acc-No.: 
AF294981; AF234301; AF234300; AF234299; AF234298; AF354046; 
AF354045) 

Resistenzgene gegen 

a) Chloramphenicol (Chloramphenicolacetyltransf erase) , 

b) Tetracyclin (u.a. GenBank Acc-No. : X65876; X51366) . Zudem 
ist das Gen bereits Bestandteil zahlreicher Expressions- 
vektoren und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden 

c) Streptomycin (u.a. GenBank Ac c . -No . : AJ278607). 

d) Zeocin, das entsprechende Resistenzgen ist Bestandteil 
zahlreicher Klonierungsvektoren (z.B. GenBank Acc-No.: 
L36849) und kann unter Verwendung von dem Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden. 

e) Ampicillin (^-Lactamase Gen; Datta N, Richmond MH 
(1966) Biochem J 98(l):204-9; Heffron F et al (1975) 
J. Bacteriol 122: 250-256; Bolivar F et al. (1977) 
Gene 2:95-114). Die Sequenz ist Bestandteil zahlreicher 
Klonierungsvektoren und kann unter Verwendung von dem 
Fachmann gelaufigen Verfahren (wie beispielsweise Poly- 
merasekettenreaktion) aus diesen isoliert werden. 

Gene wie die Isopentenyltransf erase aus Agrobakterium tumefaciens 
(strain:P022) (Genbank Acc-No.: AB025109) konnen auch als Selek- 
tionsmarker eingesetzt werden. Das ipt Gen ist ein Schliisselenzym 
der Cytokinin-Biosynthese . Seine Uberexpression erleichtert die 
Regeneration von Pflanzen (z.B. Selektion auf Cytokinin-f reiem 
Medium) . Das Verfahren zur Nutzung des ipt Gens ist beschrieben 
(Ebinuma H et al. (2000) Proc Natl Acad Sci USA 94:2117-2121; 
Ebinuma H et al . (2000) Selection of Marker-free transgenic 
plants using the oncogenes (ipt, rol A, B, C) of Agrobakterium 
as selectable markers, In Molecular Biology of Woody Plants. 
Kluwer Academic Publishers) . 

Verschiedene weitere positive Selektionsmarker , die den trans - 
formierten Pflanzen einen Wachstumsvorteil gegeniiber ni cht- trans - 
formierten verleihen, sowie Verfahren zu ihrer Verwendung sind 
u.a. beschrieben in EP-A 0 601 092. Beispielhaft sind zu nennen 
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{J-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose), UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose). 

5 Fur einen in Plastiden funktionellen Selektionsmarker sind ins- 
besondere solche bevorzugt, die eine Resistenz gegen Spectino- 
mycin, Streptomycin, Kanamycin, Lincomycin, Gentamycin, Hygro- 
mycin, Methotrexat, Bleomycin, Phleomycin, Blasticidin, Sulfon- 
amide Phosphinotricin, Chlor sulfur on, Bromoxymil, Glyphosat, 

10 2, 4-Datrazin, 4 -methyl tryptophan, Nitrat, S-aminoethyl- 

L-cysteine, Lysin/Threonin, Aminoethyl-Cystein oder Betainaldehyd 
verleihen. Besonders bevorzugt sind die Gene aadA, nptll, BADH, 
FLARE-S (eine Fusion aus aadA und GFP, beschrieben bei Khan MS 
& Maliga P (1999) Nature Biotech 17:910-915). Geeignet ist vor 

15 allem das aadA Gen (Svab Z und Maliga P (1993) Proc Natl Acad 
Sci USA 90:913-917). Ferner beschrieben sind modifizierte 16S 
rDNA sowie die Betainealdehyddehydrogenase (BADH) aus Spinat 
(Daniell H et al. (2001) Trends Plant Science 6:237-239; Daniell 
H et al. (2001) Curr Genet 39:109-116; WO 01/64023; WO 01/64024; 

20 WO 01/64850) . Auch lethal wirkende Agenzen wie beispielsweise 

Glyphosat konnen in Verbindung mit entsprechend detoxif izierenden 
oder resistenten Enzymen genutzt werden (WO 01/81605) . 

Die jeweils fur die Selektion verwendeten Konzentrationen 
25 der Antibiotika, Herbizide, Biozide oder Toxine mussen an die 
jeweiligen Testbedingungen bzw. Organismen angepasst werden. 
Beispielhaft seien fur Pflanzen zu nennen Kanamycin (Km) 50 mg/L, 
Hygromycin B 40 mg/L, Phosphinothricin (Ppt) 6 mg/L, Sepctino- 
mycin (Spec) 500 mg/L. 



30 



Reportergene 



Reportergene kodieren fur leicht quantif izierbare Proteine 
und gewahrleisten so iiber Eigenfarbe oder Enzymaktivitat eine 
35 Bewertung der Transf ormationsef f izienz , des Expressionsortes oder 
-zeitpunktes . Ganz besonders bevorzugt sind dabei Gene kodierend 
fur Reporter-Proteine (siehe auch Schenborn E, Groskreutz D 
(1999) Mol Biotechnol 13(l):29-44) wie 

4Q - "green fluorescence protein" (GFP) (Chui WL et al. (1996) 
Curr Biol 6:325-330; Leffel SM et al. (1997) Biotechniques 
23(5): 912-8; Sheen et al . (1995) Plant J 8 ( 5 ) : 777-784 ; 
Haseloff et al . (1997) Proc Natl Acad Sci USA 94(6): 
2122-2127; Reichel et al . (1996) Proc Natl Acad Sci USA 

45 93 (12) :5888-5893; Tian et al . (1997) Plant Cell Rep 

16:267-271; WO 97/41228) 
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5 8 

Chi or amphenic ol trans f er as e 

Luzif erase (Millar et al . (1992) Plant Mol Biol Rep 10: 
324-414; Ow et al . (1986) Science 234:856-859); erlaubt 
5 Bioluminescenzdetektion 

p-Galactosidase (kodiert fur ein Enzym fur das verschiedenen 
chromogene Substrate zur Verftigung stehen) 

10 - ^-Glucuronidase (GUS) (Jefferson et al. (1987) EMBO J 6: 
3901-3907) oder das uidA Gen (kodieren fur Enzyme fiir die 
verschiedene chromogene Substrate zur Verfugung stehen) 

- R-Locus Genprodukt, das die Produktion von Anthocyanin- 
15 pigmenten (rote Farbung) in pflanzlichen Gewebe reguliert und 

so eine direkte Analyse der Promoteraktivitat ohne Zugabe 
zusatzlicher Hilfsstoffe oder chromogener Substrate ermog- 
licht (Dellaporta et al. (1988) In: Chromosome Structure 
and Function: Impact of New Concepts, 18 th Stadler Genetics 
20 Symposium, 11:263-282) 

Tyrosinase (Katz et al.(1983) J Gen Microbiol 129:2703- 
2714) , Enzym, das Tyrosin zu DOPA und Dopaquinon oxidiert, 
die infolge das leicht nachweisbare Melanin bilden. 

25 

Aequorin (Prasher et al.(1985) Biochem Biophys Res Commun 
126 (3 ): 1259-1268) , kann in der Calcium-sensitiven Bio- 
luminescenzdetektion verwendet werden. 

30 3. Replikationsursprunge, die eine Vermehrung der erfindungs- 
gemaiSen Expressionskassetten oder Vektoren in zum Beispiel 
E.coli gewahrleisten. Beispielhaft seien genannt ORI (origin 
of DNA replication), der pBR322 ori oder der P15A ori 
(Sambrook et al . : Molecular Cloning. A Laboratory Manual, 

35 2 nd ed. Cold Spring Harbor Laboratory Press, Cold Spring 

Harbor, NY, 1989) . 

4. Elemente zum Beispiel "Bordersequenzen" , die einen Agro- 
bakterien-vermittelte Transfer in Pf lanzenzellen fiir 
40 die Ubertragung und Integration ins Pf lanzengenom ermog- 

lichen, wie zum Beispiel die rechte oder linke Begrenzung 
der T— DNA oder die vir-Region. 



5. 

45 



Multiple Klonierungsregionen (MCS) erlauben und erleichtern 
die Insertion eines oder mehrerer Nukleinsauresecjuenzen. 
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Die Einfuhrung von Nukleinsauresequenzen (z.B. Expressions - 
kassetten) in einen pflanzlichen Organismus oder Zellen, Geweben, 
Organe, Teile bzw. Samen desselben kann vorteilhaft unter Ver- 
wendung von Vektoren realisiert werden, in denen diese Sequenzen 
5 enthalten sind. Vektoren konnen beispielhaf t Plasmide, Cosmide, 
Phagen, Viren oder auch Agrobakterien sein. Die Sequenzen konnen 
in den Vektor (bevorzugt ein Plasmidvektor) iiber geeignete 
Restriktionsschnittstellen insertiert werden. Der entstandene 
Vektor kann zunachst in E.coli eingefuhrt und amplif iziert 

10 werden. Korrekt trans formierte E.coli werden selektioniert , 

geziichtet und der rekombinante Vektor mit dem Fachmann gelauf igen 
Methoden gewonnen. Restriktionsanalyse und Sequenzierung konnen 
dazu dienen, den Klonierungsschritt zu ttberpriifen. Bevorzugt sind 
solche Vektoren, die eine stabile Integration in das Wirtsgenom 

15 ermoglichen. 

Die Herstellung eines transf ormierten Organismus (bzw. einer 
trans formier ten Zelle oder Gewebes) erfordert, dass die ent- 
sprechende DNA (z.B. der Trans f ormationsvektor) oder RNA in die 

20 entsprechende Wirts zelle eingebracht wird. Fur diesen Vorgang, 
der als Transformation (oder Transduktion bzw. Trans fektion) 
bezeichnet wird, steht eine Vielzahl von Methoden und Vektoren 
zur Verfiigung (Keown et al . (1990) Methods in Enzymology 
185:527-537; Plant Molecular Biology and Biotechnology (CRC 

25 Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); 

White FF (1993) Vectors for Gene Transfer in Higher Plants; in: 
Transgenic Plants, Bd. 1, Engineering and Utilization, Hrsgb. : 
Kung und Wu R, Academic Press, 15-38; Jenes B et al. (1993) 
Techniques for Gene Transfer, in: Transgenic Plants, Bd. 1, 

30 Engineering and Utilization, Hrsgb. : Kung und R. Wu, Academic 
Press, S. 128-143; Potrykus (1991) Annu Rev Plant Physiol Plant 
Molec Biol 42:205-225; Halford NG, Shewry PR (2000) Br Med Bull 
56(1) :62-73) . 

35 Beispielsweise kann die DNA oder RNA direkt durch Mikroinjektion 
(WO 92/09696, WO 94/00583, EP-A 0 331 083, EP-A 0 175 966) oder 
durch Bombardierung mit DNA bzw. RNA-beschichteten Mikropartikeln 
(biolistische Verfahren mit der Genkanone "particle bombardment"; 
US 5,100,792; EP-A 0 444 882; EP-A 0 434 616; Fromm ME et al . 

40 (1990) Bio /Techno logy 8(9):833-9; Gordon-Karom et al . (1990) Plant 
Cell 2:603) eingefuhrt werden. Auch kann die Zelle chemisch, zum 
Beispiel mit Polyethylenglycol , permeabilisiert werden, so dass 
die DNA durch Diffusion in die Zelle gelangen kann. Die DNA kann 
auch durch Protoplastenfusion mit anderen DNA-enthaltenden Ein- 

45 heiten wie Minicells, Zellen, Lysosomen oder Liposomen (Freeman 
et al. (1984) Plant Cell Physiol. 29:1353ff; US 4,536,475) 
erfolgen. Elektroporation ist eine weitere geeignete Methode 
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zur Einftihrung von DNA, bei der die Zellen reversibel durch 
einen elektrischen Impuls permeabilisert werden (EP-A 290 395, 
WO 87/06614) . Weitere Verfahren umfassen die Calciumphosphat- 
vermittelte Transformation, die DEAE-Dextran-vermittelte Trans- 
5 formation, die Inkubation trockener Embryonen in DNA-hal tiger 
Losung, oder andere Methoden der direkten DNA-Einf iihrung 
(DE 4 005 152, WO 90/12096, US 4,684,611). Entsprechende Ver- 
fahren sind beschrieben (beispielsweise bei Bilang et al. (1991) 
Gene 100:247-250; Scheid et al. (1991) Mol Gen Genet 228:104-112; 

10 Guerche et al . (1987) Plant Science 52:111-116; Neuhause et al. 
(1987) Theor Appl Genet 75:30-36; Klein et al . (1987) Nature 
327:70-73; Howell et al . (1980) Science 208:1265; Horsch et 
al.(1985) Science 227:1229- 1231; DeBlock et al . (1989) Plant 
Physiology 91:694-701; Methods for Plant Molecular Biology 

15 (Weissbach and Weissbach, eds.) Academic Press Inc. (1988); and 
Methods in Plant Molecular Biology (Schuler and Zielinski, eds.) 
Academic Press Inc. (1989)). Physikalische Methoden der DNA- 
Einf tihrung in pflanzliche Zelle sind ira Uberblick dargestellt 
bei Oard (1991) Biotech Adv 9:1-11. 



20 



Im Falle dieser "direkten" Trans format ionsmethoden sind keine 
besonderen Anf orderungen an das verwendete Plasmid gestellt. 
Einfache Plasmide wie die der pUC-Reihe, pBR322, Ml3mp Reihe, 
pACYC184 etc. konnen verwendet werden. 

25 

Neben diesen "direkten" Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobacterium 
(z.B. EP 0 116 718), virale Infektion mittels viraler Vektoren 
(EP 0 067 553; US 4,407,956; WO 95/34668; WO 93/03161) oder 
30 mittels Pollen (EP 0 270 356; WO 85/01856; US 4,684,611) durch- 
gefiihrt werden. 

Bevorzugt erfolgt die Transformation mittels Agrobacterien, 
die "entwaf fnete" (disarmed) Ti-Plasmidvektoren enthalten, 

35 wobei deren naturliche Fahigkeit zum Gentransfer auf Pflanzen 
genutzt wird (EP-A 0 270 355; EP-A 0 116 718). Agrobacterium- 
Transformation ist weit verbreitet fur die Transformation von 
Dicotyledonen, wird aber auch zunehmend auf Monocotyledonen 
angewandt (Toriyama et al . (1988) Bio/Technology 6: 1072-1074; 

40 Zhang et al . (1988) Plant Cell Rep 7:379-384; Zhang et al . (1988) 
Theor Appl Genet 76:835-840; Shimamoto et al . (1989) Nature 
338:274-276; Datta et al . (1990) Bio/Technology 8: 736-740; 
Christou et al . (1991) Bio/Technology 9:957-962; Peng et al . 
(1991) International Rice Research Institute, Manila, Philippines 

45 563-574; Cao et al . (1992) Plant Cell Rep 11:585-591; Li et al . 

(1993) Plant Cell Rep 12:250-255; Rathore et al . (1993) Plant Mol 
Biol 21:871-884; Fromm et al. (1990) Bio/Technology 8:833-839; 
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Gordon-Kamm et al. (1990) Plant Cell 2:603-618; D'Halluin et al . 
(1992) Plant Cell 4:1495-1505; Walters et al . (1992) Plant Mol 
Biol 18:189-200; Koziel et al . (1993) Biotechnology 11:194-200; 
Vasil IK (1994) Plant Mol Biol 25:925-937; Weeks et al . (1993) 
5 Plant Physiol 102:1077-1084; Somers et al . (1992) Bio /Technology 
10:1589-1594; WO 92/14828; Hiei et al. (1994) Plant J 6:271-282). 

Die fur die Agrobacterium-Trans formation meist verwendeten Stamme 
Agrobacterium tumefaciens oder Agrobacterium rhizogenes enthalten 

10 ein Plasmid (Ti bzw. Ri Plasmid) , das auf die Pflanze nach Agro- 
bakterium-Infektion xibertragen wird. Ein Teil dieses Plasmids, 
genannt T-DNA (transferred DNA) , wird in das Genom der Pflanzen - 
zelle integriert. Alternativ konnen durch Agrobakterium auch 
binare Vektoren (Mini-Ti-Plasmide) auf Pflanzen ubertragen und 

15 in deren Genom integriert werden. 

Die Anwendung von Agrobakterium tumefaciens fur die Trans- 
formation von Pflanzen unter Verwendung von Gewebekultur- 
explantaten ist beschrieben (u.a. Horsch RB et al. (1985) 

20 Science 225:1229ff; Fraley et al. (1983) Proc Natl Acad Sci 
USA 80: 4803-4807; Bevans et al. (1983) Nature 304:184-187). 
Viele Stamme von Agrobakterium tumefaciens sind in der Lage, 
genetisches Material zu ubertragen, wie z.B. die Stamme 
EHAl01[pEHAl01] , EHA105 [pEHA105 ] , LBA4404 [pAL4404 ] , C58Cl[pMP90] 

25 und C58Cl[pGV2260] (Hood et al . (1993) Transgenic Res 2:208-218; 
Hoekema et al. (1983) Nature 303:179-181; Koncz and Schell (1986) 
Gen Genet 204:383-396; Deblaere et al. (1985) Nucl Acids Res 13: 
4777-4788) . 

30 Werden Agrobacterien verwendet , so ist die Expressionskassette 

in spezielle Plasmide zu integrieren, entweder in einen Zwischen- 
vektor (englisch: shuttle or intermediate vector) oder einen 
binaren Vektor. Wird ein Ti oder Ri Plasmid zur Transformation 
verwendet, ist zumindest die rechte Begrenzung, meistens jedoch 

35 die rechte und die linke Begrenzung der Ti oder Ri Plasmid T-DNA 
als flankierende Region mit der einzufuhrenden Expressionskas- 
sette verbunden. Bevorzugt werden binare Vektoren verwendet. 
Binare Vektoren konnen sowohl in E.coli als auch in Agrobacterium 
replizieren und enthalten die zur Ubertragung in ein pflanzliches 

40 System erf or der lichen Komponenten. Sie enthalten in der Regel ein 
Selektionsmarkergen fur die Selektion trans formierter Pflanzen 
(z.B. das nptll Gen, das eine Resistenz gegen Kanamycin verleiht) 
und einen Linker oder Polylinker flankiert von der rechten und 
linken T-DNA Begrenzungssequenz . AuSerhalb der T-DNA-Begrenzungs- 

45 sequenz enthalten sie zudem noch einen Selektionsmarker , der eine 
Selektion transf ormierter E.coli und/oder Agrobakteria ermOglicht 
(z.B. das nptlll Gen, das eine Resistenz gegen Kanamycin ver- 
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leiht) . Entsprechende Vektoren konnen direkt in Agrobakterium 
transformiert werden (Holsters et al. (1978) Mol Gen Genet 
163:181-187) . 

5 Binarvektoren basieren z.B. auf "broad host range "-Plasmiden 
wie pRK252 (Bevan et al . (1984) Nucl Acid Res 12,8711-8720) und 
pTJS75 (Watson et al . (1985) EMBO J 4(2):277- 284). Eine grosse 
Gruppe der verwendeten Binarvektoren leitet sich vom pBIN19 
(Bevan et al. (1984) Nucl Acid Res 12:8711-872 0) ab. Hajdukiewicz 
10 et al. entwickelten einen Binarvektor (pPZP) , der kleiner und ef- 
fizienter als die bisher ublichen ist (Hajdukiewicz et al . (1994) 
Plant Mol Biol 25:989-994). Verbesserte und besondere bevor- 
zugte binare Vektorsysteme zur Agrobakterium-vermittelten Trans- 
formation sind in WO 02/00900 beschrieben. 

15 

Die mit einem solchen Vektor trans formier ten Agrobakterien konnen 
dann in bekannter Weise zur Transformation von Pflanzen, ins- 
besondere von Kulturpf lanzen, wie z.B. von Raps, verwendet 
werden, indem beispielsweise verwundete Blatter oder Blattstucke 

20 in einer Agrobakterienlosung gebadet und anschlies send in geeig- 
neten Medien kultiviert werden. Die Transformation von Pflanzen 
durch Agrobakterien ist beschrieben (White FF, Vectors for 
Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. Kung und 

25 R. Wu, Academic Press, 1993, S. 15-38; Jenes B et al.(1993) 
Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. Kung und 
R. Wu, Academic Press, S. 128-143; Potrykus (1991) Annu Rev 
Plant Physiol Plant Molec Biol 42:205- 225). Aus den trans- 

30 formier ten Zellen der verwundeten Blatter bzw. Blattstucke 

konnen in bekannter Weise transgene Pflanzen regeneriert werden. 

Fur die Transformation konnen unterschiedliche Explantate, Zell- 
kulturen, Gewebe, Organen, Embryonen, Samen, Mikrosporen oder 

35 anderen einzelzelligen oder mehrzelligen zellulare Strukturen 
abgeleitet von einem pflanzlichen Organismus eingesetzt werden. 
Auf die jeweiligen Explantate, Kulturen oder Gewebe abgestimmte 
Transf ormationsverf ahren sind dem Fachmann bekannt. Beispielhaft 
seien zu nennen: Sprossinternodien (Fry J et al. (1987) Plant 

40 Cell Rep. 6:321-325), Hypokotyle (Radke SE et al . (1988) Theor 

Appl Genet 75:685-694; Schroder M et al . (1994) Physiologia Plant 
92: 37-46.; Stefanov I et al . (1994) Plant Sci. 95:175-186; Weier 
et al. (1997) Fett/Lipid 99:160-165), kotyledonare Petiolen 
(Meloney MM et al . (1989) Plant Cell Rep 8:238-242; Weier D 

45 et al. (1998) Molecular Breeding 4:39-46), Mikrosporen und Pro- 
embryonen (Pechnan (1989) Plant Cell Rep. 8:387-39 0) und Bliiten- 
stiele (Boulter ME et al. (1990) Plant Sci 70:91-99; Guerche P 
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et al. (1987) Mol Gen Genet 206:382-386). Bei einem direkten Gen- 
transfer k6nnen Mesophyllprotoplasten (Chapel PJ & Glimelius K 
(1990) Plant Cell Rep 9: 105-108; Golz et al . (1990) Plant 
Mol Biol 15:475-483) aber auch Hypokotylprotoplasten (Bergmann 
5 P & Glimelius K (1993) Physiologia Plant 88:604-611) und Mikro- 
sporen (Chen JL et al. (1994) Theor Appl Genet 88:187-192; 
Jonesvilleneuve E et al . (1995) Plant Cell Tissue and Organ 
Cult 40:97-100) und Sprossabschnitte (Seki M et al. (1991) 
Plant Mol Biol 17:259-263) erfolgreich eingesetzt werden. 

10 

Stabil transf ormierte Zellen d.h. solche, die die eingefiihrte 
DNA integriert in die DNA der Wirtszelle enthalten, konnen von 
untransf ormierten unter Einsatz des erf indungsgemaSen Selektions- 
verfahrens selektioniert werden. Die erhaltenen Pflanzen konnen 
15 in ublicher Weise geziichtet und gekreuzt werden. Zwei oder mehr 
Generationen sollten vorzugsweise kultiviert werden, urn sicher- 
zustellen, dass die genomische Integration stabil und vererblich. 
ist . 

20 Sobald eine transf ormierte Pf lanzenzelle hergestellt wurde, kann 
eine vollstandige Pflanze unter Verwendung von dem Fachmann 
bekannten Verfahren erhalten werden. Hierbei geht man beispiel- 
haft von Kalluskulturen, einzelnen Zellen (z.B. Protoplasten) 
oder Blattscheiben aus (Vasil et al . (1984) Cell Culture and 

25 Somatic Cel Genetics of Plants, Vol I , II and III, Laboratory 

Procedures and nTheir Applications, Academic Press; Weissbach and 
Weissbach (1989) Methods for Plant Molecular Biology, Academic 
Press) . Aus diesen noch undif f erenzierten Callus-Zellmassen kann 
die Bildung von Spross und Wurzel in bekannter Weise induziert 

30 werden. Die erhaltenen Sprosslinge konnen ausgepflanzt und 
geziichtet werden. Entsprechende Verfahren sind beschrieben 
(Fennell et al . (1992) Plant Cell Rep. 11: 567-570; Stoeger 
et al. (1995) Plant Cell Rep. 14:273-278; Jahne et al . (1994) 
Theor Appl Genet 89:525-533). 

35 

Die Wirksamkeit der Expression der transgen exprimierten Nuklein- 
sauren kann beispielsweise in vitro durch Sprossmeristemver- 
mehrung unter Verwendung einer der oben beschriebenen Selektions- 
methoden ermittelt werden. Zudem kann eine in Art und Hohe ver- 
40 anderte Expression eines Zielgens und die Auswirkung auf den 
Phanptyp der Pflanze an Testpflanzen in Gewachshausversuchen 
getestet werden. 

Bevorzugt wird das erf indungsgema&e Verfahren im Rahmen der 
45 Pf lanzenbiotechnologie zur Erzeugung von Pflanzen mit vor- 
teilhaften Eigenschaf ten eingesetzt. Die in das Genom der 
pflanzlichen Zelle oder des pflanzlichen Organismus zu 
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• insert ierende Nukleinsauresequenz" umfasst bevorzugt min- 
destens eine Expressionskassette, wobei besagte Expressions - 
kassette unter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen f link ti one 11 en Promotors eine RNA und/oder 
5 ein Protein exprimieren kann, welche nicht die Verminderung der 
Expression, Menge, Aktivitat und/oder Funktion eines Marker- 
proteins bewirken, sondern - besonders bevorzugt - der so 
genetische veranderten Pflanze einen vorteilhaf ten Phanotyp ver- 
leihen. Dem Fachmann sind zahlreiche Gene und Proteine bekannt, 
10 die zum Erreichen eines vorteilhaf ten Phanotyp beispielsweise 
zur Qualit&tssteigerung bei Nahrungsmitteln oder zur Produktion 
bestimmter Chemikalien oder Pharmazeutika (Dunwell JM (2000) 
J Exp Bot 51 Spec No: 487-96) verwendet werden konnen. 

15 So kann die Eignung der Pflanzen oder deren Samen als Nahrungs- 
oder Futtermittel verbessert werden, beispielsweise liber eine 
Veranderung der Zusammensetzungen und/oder des Gehalt an Meta- 
boliten, insbesondere Proteinen, Olen, Vitaminen und/oder Starke. 
Auch konnen Wachstumsrate, Ertrag oder die Resistenz gegen bio- 

20 tische oder abiotische Stressf aktoren erhoht werden. Vorteilhaf te 
Ef fekte konnen sowohl durch transgene Expression von Nuklein- 
sauren oder Proteinen als auch durch gezielte Verminderung der 
Expression endogener Gene hinsichtlich des Phanotypes der trans - 
genen Pflanze erzielt werden. Die in der transgenen Pflanze zu 

25 erzielenden vorteilhaf ten Ef fekte umfassen beispielsweise: 

Erhohte Resistenz gegen Pathogene (biotischer Stress) 

Erhohte Resistenz gegen Umwelteinf liisse wie Hitze, Kalte, 
30 Frost Trockenheit, UV-Licht, oxidativen Stress, Nasse, Salz 

etc. (abiotischer Stress) 



Erhohte Ertragsleistung 



35 - Verbesserte Qualitat z.B. erhohter Nahrwert, erhohte Lager- 
fahigkeit 

Ein weiterer Gegenstand der Erfindung betrifft die Verwendung der 
nach dem erf indungsgemassen Verfahren hergestellten transgenen 

40 Pflanzen f und der von ihnen abgeleitete Zellen, Zellkulturen, 
Teile oder Vermehrungsgut wie Saaten oder Friichte, zur Her- 
stellung von Nahrungs- oder Futtermitteln, Pharmazeutika 
oder Feinchemikalien, wie beispielsweise Enzymen, Vitaminen, 
Aminosauren, Zucker, Fettsauren, naturliche und synthetische 

45 Geschmacks-, Aroma- und Farbstoffe. Besonders bevorzugt ist die 
Produktion von Triaclyglyceriden, Lipiden, Olen, Fettsauren, 
Starke, Tocopherolen und Tocotrienolen sowie Carotinoiden. Von 
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Menschen und Tieren verzehrbare erf indungsgem&fce , genetisch 
veranderte Pflanzen konnen auch beispielsweise direkt oder nach 
an sich bekannter Aufbereitung als Nahrungsmittel oder Futter- 
mitt el verwendet werden. 
5 Wie bereits oben erwahnt, umfasst das erf indungsgema£e Verfahren 
in einer besonders vorteilhaf ten Ausfiihrungsf orm in einem der 
Selektion nachgeschalteten Verf ahrenschritt die Deletion der fur 
das Markerprotein kodierenden Sequenz (z.B. durch Rekombinase 
vermittelt oder wie in WO03/004659 beschrieben) bzw. die Aus- 

10 kreuzung und/oder Segregation besagter Sequenzen. (Dem Fachmann 
ist klar, das dazu in den trans formierten Zellen die in das Genom 
integrierte Nukleins&ureseuqnz und die fur das Markerprotein 
kodierende Sequenz einen separaten chromosomalen Lokus aufweisen 
sollten. Dies ist jedoch bei der Mehrzahl der resultierenden 

15 Pflanzen allein aus statistischen Grunden gegeben) . Diese Vor- 
gehensweise ist insbesondere vorteilhaf t, wenn es sich bei dem 
Markerprotein um ein Transgen handelt, das ansonsten in der zu 
trans formierenden Pflanze nicht vorkommt. Die resultierende 
Pf lanze kann zwar noch unter Umstanden die Verbindung zur Ver- 

20 minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins beinhalten, doch hatte diese kein "Gegenstuck" 
mehr in Form des besagten Markerproteins, ware also wirkungslos . 
Dies ist insbesondere dann der Fall, wenn das Markerprotein aus 
einem nicht-pf lanzlichen Organismus staramt und/oder synthetisch 

25 ist (beispielsweise das codA Protein) . Es konnen aber auch 

Pflanzliche Markperproteine aus anderen Pf lanzenarten eingesetzt 
werden, die in der zu trans formierenden Zelle ansonsten (d.h. 
wenn nicht als Transgen eingefiihrt) nicht vorkommen. Besagte 
Markerproteine sind im Rahmen dieser Erfindung als n nicht-endo- 

30 gene" Markerproteine bezeichnet. 

Ganz besonders vorteilhaf t ist es, wenn es sich bei der Ver- 
bindung zur Verminderung der Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins um eine RNA handelt. Nach 

35 der Deletion bzw. Auskreuzung/Segregation wiirde die resultierende 
transgene Pflanze kein unn6tiges (und ggf . unerwunschtes) Fremd- 
protein mehr aufweisen. Einziges Fremdprotein ist u.U. das aus 
der in das Genom insertierten Nukleinsauresequenz resultierenden 
Protein. Aus Grunden der Produktzulassung ist diese Ausftihrungs- 

40 form besondersvorteilhaf t . Wie oben beschrieben kann diese RNA 
eine antisense RNA oder - besonders bevorzugt - eine doppel- 
strangige RNA sein. Sie kann separat von der fur das Zielprotein 
kodierenden RNA exprimiert werden, aber - unter Umstanden - auch 
auf einem Strang mit derselben. 
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Zusammenfassend umfasst die besonders vorteilhafte Ausfuhrungs- 
form folgende Merkmale: 

Verfahren zur Herstellung trans formierter pflanzlicher Zellen 
5 oder Organismen, umfassend nachf olgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, welche 
mindestens ein nicht-endogenes (bevorzugt nicht-pf lanzliches) 
Markerprotein umfasst, das in der Lage ist, eine fur besagte 

10 Population pflanzlicher Zellen nicht-toxische Substanz X in 

eine fur besagte Population toxische Substanz Y direkt oder 
indirekt umzusetzen, mit mindestens einer zu insertierenden 
Nukleinsauresequenz in Kombination mit mindestens einer 
Nukleinsauresequenz kodierend fur eine Ribonukleinsaure- 

15 sequenz befahigt zur Verminderung der Expression, Menge, 

Aktivitat und/oder Funktion besagten Markerproteins , und 

b) Behandlung besagter Population pflanzlicher Zellen mit der 
Substanz X in einer Konzentration, die infolge der Umsetzung 

20 durch das Markerprotein einen fur nicht-transf ormierte Zellen 

toxischen Effekt bedingt, und 

c) Selektion von transf ormierten pflanzlichen Zellen (und/oder 
Populationen pflanzlicher Zellen wie pflanzlichen Geweben 

25 oder Pf lanzen) , die in ihrem Genom besagte Nukleinsaurese- 

quenz aufweisen und die infolge der Wirkung besagter Ver- 
bindung gegenuber nicht-transf ormierten Zellen einen Wachs- 
tumsvorteil haben, aus besagter Population pflanzlicher 
Zellen, wobei die Selektion unter Bedingungen durchgefuhrt 

30 wird, bei denen das Markerprotein seinen toxischen Effekt 

auf die nicht- transf ormierten Zellen ausiiben kann, und 

d) Regeneration von fertilen Pf lanzen, und 

35 e) Auskreuzung der fur das Markerprotein kodierenden Nuklein- 
sauresequenz und Isolation von fertilen Pflanzen, die in 
ihrem Genom besagte Nukleinsauresequenz aber nicht mehr die 
fur das Markerprotein kodierende Sequenz aufweisen. 

40 Sequenz en 

1. SEQ ID NO: 1 Nukleinsauresequenz kodierend fiir Cytosin- 

deaminase aus E.coli (codA) 



45 2. SEQ ID NO: 2 Aminosauresequenz kodierend fiir Cytosin- 

deaminase aus E.coli (codA) 
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3. SEQ ID NO: 3 Nukleinsauresequenz kodierend fiir Cytosin- 

deaminase aus E.coli (codA) mit modi fizier tern 
Startkodon (GTG/ATG) zur Expression in 
Eukaryoten 

5 

4. SEQ ID NO: 4 Amino sauresequenz kodierend fur Cytosin- 

deaminase aus E.coli (codA) mit modif iziertem 
Startkodon (GTG/ATG) zur Expression in 
Eukaryoten 

10 

5. SEQ ID NO: 5 Nukleinsauresequenz kodierend fiir Cytochrom 

P450-SU1 (suaC) aus Streptomyces griseolus 

6. SEQ ID NO: 6 Amino sauresequenz kodierend fiir Cytochrom 
15 P45 0-SU1 (suaC) aus Streptomyces griseolus 

7. SEQ ID NO: 7 Nukleinsauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumefaciens 

20 

8. SEQ ID NO: 8 Aminosauresequenz kodierend fiir 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumefaciens 

25 9. SEQ ID NO: 9 Nukleinsauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumefaciens 

10. SEQ ID NO: 10 Aminosauresequenz kodierend fiir 

30 Indolacetamidhydrolase (tms2) aus Agrobacterium 

tumefaciens 

11. SEQ ID NO: 11 Nukleinsauresequenz kodierend fur Haloalkan- 

dehalogenase (dhlA) aus Xanthobacter 
35 autotrophicus 

12. SEQ ID NO: 12 Aminosauresequenz kodierend fiir Haloalkan- 

dehalogenase (dhlA) aus Xanthobacter 
autotrophicus 

40 

13. SEQ ID NO: 13 Nukleinsauresequenz kodierend fiir Thymidin- 

kinase aus Herpes simplex Virus 1 



14. SEQ ID NO: 14 Aminosauresequenz kodierend fur Thymidin- 
45 kinase aus Herpes simplex Virus 1 
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15. SEQ ID NO: 15 Nukleinsauresequenz kodierend fur Thymidin- 

kinase aus Herpes simplex Virus 1 

16. SEQ ID NO: 16 Aminosauresequenz kodierend fur Thymidin- 
5 kinase aus Herpes simplex Virus 1 

17. SEQ ID NO: 17 Nukleinsauresequenz kodierend ftir Hypoxanthin- 

Xanthin-Guanin Phosphoribosyltransf erase aus 
Toxoplasma gondii 

10 

18. SEQ ID NO: 18 Aminosauresequenz kodierend fur Hypoxanthin- 

Xanthin-Guanin Phosphoribosyltransf erase aus 
Toxoplasma gondii 

15 19. SEQ ID NO: 19 Nukleinsauresequenz kodierend fur Xanthin- 

Guanin-Phosphoribosyltransf erase aus E.coli 

20. SEQ ID NO: 20 Aminosauresequenz kodierend fur Xanthin-Guanin- 

Phosphoribosyltransf erase aus E.coli 

20 

21. SEQ ID NO: 21 Nukleinsauresequenz kodierend fur Xanthin- 

Guanin- Phosphoribosyltransf erase aus E.coli 

22. SEQ ID NO: 22 Aminosauresequenz kodierend fur Xanthin-Guanin- 
25 Phosphoribosyltransf erase aus E.coli 

23. SEQ ID NO: 23 Nukleinsauresequenz kodierend fur Purin- 

nukleosidphosphorylase (deoD) aus E.coli 

30 24. SEQ ID NO: 24 Nukleinsauresequenz kodierend fur Purin- 

nukleosidphosphorylase (deoD) aus E.coli 

25. SEQ ID NO: 25 Nukleinsauresequenz kodierend fur Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
35 caryophylli 

26. SEQ ID NO: 26 Aminosauresequenz kodierend fur Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
caryophylli 

40 

27. SEQ ID NO: 27 Nukleinsauresequenz kodierend fur Tryptophan- 

oxygenase (auxl) aus Agrobacterium rhizogenes 

28. SEQ ID NO: 28 Aminosauresequenz kodierend fur Tryptophan- 
45 oxygenase (auxl) aus Agrobacterium rhizogenes 
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29. SEQ ID NO: 29 Nukleinsauresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
rhizogenes 

5 30. SEQ ID NO: 30 Aminos auresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
rhizogenes 

31. SEQ ID NO: 31 Nukleinsauresequenz kodierend fur Tryptophan- 
10 oxygenase (auxl) aus Agrobacterium tumefaciens 

32. SEQ ID NO: 32 Aminosauresequenz kodierend ftir Tryptophan- 

oxygenase (auxl) aus Agrobacterium tumefaciens 

15 33. SEQ ID NO: 33 Nukleinsauresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
tumefaciens 

34. SEQ ID NO: 34 Aminosauresequenz kodierend fur Indol- 

20 acetamidhydrolase (aux2) aus Agrobacterium 

tumefaciens 

35. SEQ ID NO: 35 Nukleinsauresequenz kodierend ftir Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
25 vitis 

36. SEQ ID NO: 36 Aminosauresequenz kodierend fur Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
vitis 

30 

37. SEQ ID NO: .37 Nukleinsauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Arabidopsis 
thaliana 

35 38. SEQ ID NO: 38 Aminosauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Arabidopsis 
thaliana 

39. SEQ ID NO: 39 Nukleinsauresequenz kodierend fur 5-Methyl- 
40 thioribosekinase (mtrK) aus Klebsiella 

pneumoniae 



40. SEQ ID NO: 

45 



40 Aminosauresequenz kodierend fur 5-Methyl- 
thioribosekinase (mtrK) aus Klebsiella 
pneumoniae 
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41. SEQ ID NO: 41 Nukle ins Suresequenz kodierend ftir Alkohol- 

dehydrogenase (adh) aus Arabidopsis thaliana 

42. SEQ ID NO: 42 Aminos auresequenz kodierend fur Alkohol- 

5 dehydrogenase (adh) aus Arabidopsis thaliana 

43. SEQ ID NO: 43 Nukle ins auresequenz kodierend fiir Alkohol- 

dehydrogenase (adh) aus Hordeurn vulgar e 
(Gerste) 

10 

44. SEQ ID NO: 44 Aminos auresequenz kodierend fur Alkohol- 

dehydrogenase (adh) aus Hordeurn vulgare 
(Gerste) 

15 45. SEQ ID NO: 45 Nukle ins auresequenz kodierend fur Alkohol- 

dehydrogenase (adh) aus Oryza sativa (Reis) 

46. SEQ ID NO: 46 Aminos auresequenz kodierend fur Alkohol- 

dehydrogenase (adh) aus Oryza sativa (Reis) 

20 

47. SEQ ID NO: 47 Nukle ins auresequenz kodierend fur Alkohol- 

dehydrogenase (adh) aus Zea mays (Mais) 

48. SEQ ID NO: 48 Aminos auresequenz kodierend fiir Alkohol- 
25 dehydrogenase (adh) aus Zea mays (Mais) 

49. SEQ ID NO: 49 Nukleins&uresequenz kodierend fiir ein sense-KNA 

Fragment der Cytosindeaminase aus E.coli 
( codARNAi- sense ) 

30 

50. SEQ ID NO: 50 Oligonukleotidprimer codA5 ' Hindlll 

5 ' — AAGCTTGGCTAAC AGTGTCGAATAACG -* 3 ' 

51. SEQ ID NO: 51 Oligonukleotidprimer codA3'SalI 
35 5 ' -GTCGACGACAAAATCCCTTCCTGAGG-3 ' 

52. SEQ ID NO: 52 Nukle ins auresequenz kodierend fur ein 

antisense-RNA Fragment der Cytosindeaminase aus 
E . coli ( codARNAi-anti ) 

40 

53. SEQ ID NO: 53 Oligonukleotidprimer codA5'EcoRI 

5 ' -GAATTCGGCTAACAGTGTCGAATAACG-3 ' 



54. SEQ ID NO: 54 Oligonukleotidprimer codA3'BamHI 
45 5 ' -GGATCCGACAAAATCCCTTCCTGAGG-3 ' 
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55. SEQ ID NO: 55 Vektorkonstrukt pBluKS-nitP-STLSl-35S-T 

56. SEQ ID NO: 56 Express ionsvektor pSUN-1 

5 57. SEQ ID NO: 57 Transgener Expressionsvektor pSUN-l-codA-RNAi 

58. SEQ ID NO: 58 Transgener Expressionsvektor 

pSUNl-codA-RNAi-At . Act . -2 -At . Als-R-ocsT 

59. SEQ ID NO: 59 Nukleinsauresequenz kodierend fur 5-Methyl- 
10 thioribosekinase (mtrK) aus Mais (Zea mays) ; 

Fragment 

60. SEQ ID NO: 60 Amino sauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Mais (Zea mays) ; 
15 Fragment 

61. SEQ ID NO: 61 Nukleinsauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus) , Fragment 

20 

62. SEQ ID NO: 62 Aminos auresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus) , Fragment 

25 63. SEQ ID NO: 63 Nukleinsauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus ) , Fragment 

64. SEQ ID NO: 64 Amino sauresequenz kodierend fur 5-Methyl- 
30 thioribosekinase (mtrK) aus Raps (Brassica 

napus) , Fragment 

65. SEQ ID NO: 65 Nukleinsauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Reis (Oryza sativa) 
35 Fragment 

66. SEQ ID NO: 66 Aminos auresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Reis (Oryza sativa) 
Fragment 

40 

67. SEQ ID NO: 67 Nukleinsauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Soja (Glycine max) , 
Fragment 



45 
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68. SEQ ID NO: 68 Amino sauresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Soja (Glycine max) , 
Fragment 

5 69. SEQ ID NO: 69 Oligonukleotidprimer codA5'C-term 

5 ' -CGTGAATACGGCGTGGAGTCG-3 ' 

70. SEQ ID NO: 70 Oligonukleotidprimer codA3 ' C-term 

5 ' -CGGC AGGATAATC AGGTTGG- 3 ' 

10 

71. SEQ ID NO: 71 Oligonukleotidprimer 35sT 5 # Primer 

5 ' -GTC AACGTAACC AACCCTGC - 3 ' 



15 



20 



25 



30 



35 



40 



45 
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Abbildungen 

Fig.l: Inaktivierung des Markerproteingeris mittels Einbringen 
einer Rekombinase 

5 

P: Promotor 

MP: Sequenz kodierend fur ein Markerprotein 

R1/R2 : Rekombinase-Erkennungssequenzen 
R: Rekombinase bzw. Sequenz kodierend fur 

10 Rekombinase. 

In einer bevorzugten Ausfuhrungsf orm wird die Inakti- 
vierung des Markerproteingens durch das Einbringen einer 
sequenzspezifischen Rekombinase realisiert. Bevorzugt 
15 wird die Rekombinase - wie hier dargestellt - ausgehend 

von einer Expressionskassette exprimiert. 

Das Markerproteingen ist von Erkennungssequenzen fiir 
sequenzspezif ische Rekombinasen flankiert, wobei durch 
20 Einbringen der Rekombinase Sequenzen des Markerprotein- 

gens deletiert werden und so eine Inaktivierung des 
Markerproteinsgens erf olgt . 

Fig.2-A: Inaktivierung des Markerproteingens durch Einwirken einer 
25 sequenzspezifischen Nuklease 

P : Promotor 

DS: Erkennungs sequenz zur gezielten Induk- 

tion von DNA-Doppelstrangbruchen 
30 MP-DS-MP' : Sequenz kodierend fur ein Markerprotein 

umfassend eine DS 

nDS : Inaktivierte DS 

E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbruchen 

35 

Das Markerprotein-Gen karm durch eine gezielte Mutation 
oder Deletion im Markerprotein-Gen z.B- durch sequenz- 
spezifische Induktion von DNA-Doppelstrangbruchen an 
einer Erkennungs sequenz zur gezielten Induktion von 

40 DNA-Doppelstrangbruchen in oder in der Nahe des Marker - 

protein-Gens (P-MP) realisiert werden. Der Doppelstrang- 
bruch kann in der kodierenden Region oder aber auch der 
nicht-kodierenden (wie beispielsweise dem Promotor) 
erfolgen, induziert eine illegitime Rekombination (nicht- 

45 homologe Verbindung von DNA-Enden; "non-homologous end- 
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joining") und so z.B. eine Verschiebung im Leseraster des 
Markerproteins . 

Fig.2-B: Inaktivierung des Markerproteingens durch Einwirken einer 
sequenzspezif ischen Nuklease 



P : Promotor 

DS: Erkennungssequenz zur gezielten Induk- 

tion von DNA-Doppelstrangbruchen 
MP: Sequenz kodierend fur ein Markerprotein 

nDS: Inaktivierte DS 

E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbruchen 



Das Markerprotein-Gen kann durch eine gezielte Deletion 
durch sequenzspezif ische Induktion von mehr als einem 
sequenzspezif ischen DNA-Doppelstrangbruch in oder in 
der Nahe des Markerprotein-Gens realisiert werden. Die 
Doppelstrangbruche konnen in der kodierenden Region 
oder aber auch der nicht-kodierenden (wie beispielsweise 
dem Promotor) erfolgen und induzieren eine Deletion im 
Markerprotein-Gen. Bevorzugt ist das Markerprotein-Gen 
von DS Sequenzen f lankiert und wird vollstandig durch 
Einwirken des Enzyms E deletiert. 

Fig. 3: Inaktivierung des Markerprotein-Gens durch Induktion 

einer intramolekularen homologen Rekombination infolge 
des Einwirkens einer sequenzspezif ischen Nuklease 

A/A' : Sequenzen mit einer ausreichenden Lange 

und Homologie zueinander, urn infolge des 
induzierten Doppelstrangbruches miteinander 
zu rekombinieren 

P: Promotor 

DS: Erkennungssequenz zur gezielten Induktion 

von DNA-Doppelstrangbrtichen 
MP: Sequenz kodierend fur ein Markerprotein 

E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbruchen 

Das Markerprotein-Gen kann durch eine Deletion mittels 
intramolekularen homologer Rekombination inaktiviert 
werden. Die homologe Rekombination kann durch sequenz - 
spezifische Induktion von DNA-Doppelstrangbrtichen an 
einer Erkennungs sequenz zur gezielten Induktion von 
DNA— Doppelstrangbriichen in oder in der Nahe des Marker- 
protein-Gens initiiert werden. Die homologe Rekombination 
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erfolgt zwischen den Seguenzen A und A' , die eine aus- 
reichenden Lange und Homologie zueinander haben, urn 
infolge des induzierten Doppelstrangbruches miteinander 
zu rekombinieren. Die Rekombination bewirkt eine Deletion 
5 essentieller sequenzen des Markerprotein-Gens . 

Fig. 4: Inaktivierung des Markerprotein-Gens durch intermole- 
kulare homologe Rekombination 



10 A/A' : Sequenzen mit einer ausreichenden Lange und Holomogie 

zueinander, um miteinander zu rekombinieren 
B/B' : Sequenzen mit einer ausreichenden Lange 

und Holomogie zueinander, um miteinander zu 
r ekombini er en 
15 P : Promoter 

I : zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
MP: Sequenz kodierend fur ein Markerprotein 

20 Die Inaktivierung des Markerprotein-Gens (P-MP) kann auch 

durch eine gezielte Insertion in das Markerprotein-Gen 
z.B. mittels intermolekularer homologer Rekombination 
realisiert werden. Dabei ist die zu insertierende Region 
an ihrem 5'- und 3 ' -Ende von Nukleinsauresequenzen (A' 

25 bzw. B' ) flankiert, die eine ausreichende Lange und Homo- 

logie zu entsprechenden f lankierenden Sequenzen des 
Markerproteingens (A bzw. B) aufweisen, um eine homologe 
Rekombination zwischen A und A' und B und B' zu ermog- 
lichen. Die Rekombination bewirkt eine Deletion essen- 

30 tieller sequenzen des Markerprotein-Gens . 

Fig. 5: Inaktivierung des Markerprotein-Gens durch intermole- 
kulare homologe Rekombination infolge des Einwirkens 
einer sequenzspezif ischen Nuklease 

35 

A/ A' : Sequenzen mit einer ausreichenden Lange und 

Holomogie zueinander, um miteinander zu 
rekombinieren 

B/B' : Sequenzen mit einer ausreichenden Lange 

40 und Holomogie zueinander, um miteinander zu 

r ekombini e r en 

p : Promotor 

I: zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
45 MP: Sequenz kodierend fur ein Markerprotein 

DS: Erkennungssequenz zur gezielten Induktion 

von DNA-Doppelstrangbruchen 
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E: Sequenzspzif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 

Die Inaktivierung des Markerprotein-Gens kann auch durch 
eine gezielte Insertion in das Markerprotein-Gen z.B. 
mittels intermolekularer homologer Rekombination reali- 
siert werden. Die homologe Rekombination kann durch 
sequenzspezif ische Induktion von DNA-Doppelstrangbriichen 
an einer Erkennungssequenz zur gezielten Induktion von 
DNA-Doppelstrangbriichen in oder in der Nahe des Marker - 
protein-Gens initiiert werden. Dabei ist die zu inser- 
tierende Region an ihrem 5'- und 3'-Ende von Nuklein- 
sauresequenzen (A' bzw. B' ) flankiert, die eine aus- 
reichende Lange und Homologie zu entsprechenden flan- 
kierenden Sequenzen des Markerprotein-Gens (A bzw. B) 
aufweisen, urn eine homologe Rekombination zwischen A und 
A' und B und B' zu ermoglichen. Die Rekombination bewirkt 
eine Deletion essentieller sequenzen des Markerprotein- 
Gens . 

Fig. 6: Vektorkarte fur pBluKS-nitP-STL.Sl-35S-T (SEQ ID NO: 55) 

NitP: Promotor des Nitrilasel-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al . (1996) Gene 
170:197-200) 

STLS-1 Intron: Intron des ST-LS1 Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 ( 2 ): 245-250 ) . 

35S-Term: Terminator des 35S CaMV Gens (Blumenkohlmosaik- 
virus; Franck et al . (1980) Cell 21:285-294). 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. 

Fig. 7: Vektorkarte fur den transgenen Expressionsvektor 
pSUN-l-codA-RNAi (SEQ ID NO: 57) 

NitP: Promotor des Nitrilasel-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al . (1996) Gene 
170:197-200) 



STLS-1 Intron: Intron des ST-LS1 Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2 ): 245-250 ) . 
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10 



15 



Fig, 

20 



25 



30 



35 



40 



35S-Term: Terminator des 35S CaMV Gens (Blumenkohlmosaik- 
virus ; Franck et al. (1980) Cell 21:285-294). 

codA-sense: Nukleinsauresequenz kodierend fiir ein sense- 
RNA Fragment der Cytosindeaminase aus E.coli (codARNAi— 
sense; SEQ ID NO: 49) 

codA-anti: Nukleinsauresequenz kodierend fur ein anti- 
sense-RNA Fragment der Cytosindeaminase aus E.coli 
(codARNAi-anti; SEQ ID NO: 52) 

LB/RB: Linke bzw. rechte Grenze der Agrobacterium T-DNA 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. Weitere 
Elemente stellen iibliche Elemente eines binaren Agro- 
bakterium-Vektors dar (aadA; ColEl; repA) 

8: Vektorkarte fiir den transgenen Expressionsvektor 

pSUNl-codA-RNAi-At.Act.-2-At.Als-R-ocsT (SEQ ID NO : 58) 

NitP: Promotor des Nitrilase I-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al . (1996) Gene 
170:197-200) 

STLS-1 Intron: Intron des ST-LS1 Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2) :245-250) . 

35S-Terminator : Terminator des 35S CaMV Gens (Blumenkohl- 
mosaikvirus; Franck et al . (1980) Cell 21 : 285-294 ) . 

codA-sense: Nukleinsauresequenz kodierend fur. ein sense- 
RNA Fragment der Cytosindeaminase aus E.coli (codARNAi- 
sense; SEQ ID NO: 49) 

codA-anti : Nukleinsauresequenz kodierend fur ein anti- 
sense-RNA Fragment der Cytosindeaminase aus E.coli 
(codARNAi-anti; SEQ ID NO: 52) 

Left Border/Right Border: Linke bzw. rechte Grenze der 
Agrobacterium T-DNA 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. Weitere 
Elemente stellen Iibliche Elemente eines binaren Agro- 
bakterium-Vektors dar (aadA; ColEl; repA) 
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Fig.9a-b: Sequenzvergleich von diversen 5-Methylthioribose (MTR) 
kinasen aus verschiedenen Organismen, insbesondere 
pf lanzlichen Organismen. Gezeigt sind Sequenzen aus 
Klebsiella pneumoniae, Clostridium tetani, Arabidopsis 
thaliana (A.thaliana) , Raps (Brassica napus), Sojabohne 
(Soy-1) , Reis ( Oryza sativa-1) sowie die Konsensus- 
sequenz (Consensus) . Homologe Bereiche konnen aus der 
Konsensussequenz leicht abgeleitet werden. 
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Ausfuhrungsbeispiele 
Allgemeine Methoden 

5 Die chemische Synthese von Oligonukleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 
2. Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die 
im Rahiaen der vorliegenden Erfindung durchgefuhrten Klonierungs- 
schritte wie z.B. Restriktionsspaltungen, Agarosegelelektro- 

10 phorese, Reinigung von DNA-Fragmenten, Transfer von NukleinsSuren 
auf Nitrozellulose und Nylonmembranen, Verknupfen von DNA-Frag- 
menten, Transformation von E. coli Zellen, Anzucht von Bakterien, 
Vermehrung von Phagen und Sequenz analyse rekombinanter DNA 
werden wie bei Sambrook et al. (1989) Cold Spring Harbor 

15 Laboratory Press; ISBN 0-87969-309-6 beschrieben durchgef uhrt . 
Die Sequenzierung rekombinanter DNA-Molekiile erfolgt mit einem 
Laser f luoreszenz-DNA-Sequenzierer der Firma ABI nach der Methode 
von Sanger (Sanger et al . (1977) Proc Natl Acad Sci 
USA 74:5463-5467) . 

20 

Beispiel 1: Herstellung der codA-Fragmente 

Zunachst wird eine verkurzte und am 5' bzw. 3' Ende durch 
Addition von Erkennungssequenzen der Restriktionsenzyme Hindlll 

25 und Sail modifizierte Nukleinsaurevariante des codA Gens unter 
Verwendung der PCR-Technologie hergestellt. Dazu wird ein Teil 
des codA Gens (GeneBank Acc . -No . : S56903; SEQ ID NO: 1) mittels 
Polymerasekettenreaktion (PCR) aus dem Herkunf tsorganismus E,coli 
unter Verwendung eines sense-spezif ischen Primers (codAS'Hindlll; 

3 0 SEQ ID NO: 50) und eines antisense-spezif ischen Primers 
(codA3'SalI; SEQ ID NO: 51) amplif iziert . 

codAS'Hindlll: 5 ' -AAGCTTGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO: 50) 
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35 codA3'SalI: 5 ' -GTCGACGACAAAATCCCTTCCTGAGG-3 ' (SEQ ID NO: 51) 

Die PCR erfolgt in einem 50 [tl Reaktionsansatz in dem enthalten 
sind: 

- 2 |ull (200 ng) genomische DNA von E.coll 
40 - 0,2 mM dATP, dTTP, dGTP, dCTP 

1,5 mM Mg(OAc) 2 

- 5 |Xg Rinderserum-Albumin 

40 pmol Primer u codA5 'Hindi II " 
40 pmol Primer codA3'SalI 
45 - 15 |Xl 3,3x rTth DNA Polymerase XLPuffer (PE Applied 

Biosystems ) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 
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Die PCR wird unter folgenden Zyklus-Bedingungen durchgef \ihrt : 

Schritt 1: 5 Minuten 94°C (Denaturierung) 

Schritt 2: 3 Sekunden 94°C 

5 Schritt 3: 1 Minute 60°C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 

30 Wiederholungen der Schritte 2 bis 4 

10 Schritt 5: 10 Minuten 72°C (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 

Das Amplifikat (codARNAi— sense ; SEQ ID NO: 49) wird unter Ver- 
wendung von Standardmethoden in den PCR Klonierungsvektor pGEM-T 
15 (Promega) kloniert. Die Identitat des erzeugten Amplikons wird 
durch Sequenzierung unter Verwendung des M13F (-40) Primers 
bestatigt . 

Ein weiteres verkiirztes und am 5'- bzw. 3'-Ende durch Addition 
20 von Erkennungssequenzen der Restriktionsenzyme EcoRI und BamHI 
modif iziertes Fragment des codA Gens wird mittels Polymerase- 
kettenreaktion (PCR) aus E.coli unter Verwendung eines sense- 
spezifischen Primers (codAS ' EcoRI ; SEQ ID NO: 53) und eines 
antisense-spezifischen Primers (codA3 'BamHI; SEQ ID NO: 54) 
25 amplif iziert . 

codAS' EcoRI: 5 ' -GAATTCGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO: 53) 
codA3' BamHI: 5 ' -GGATCCGACAAAATCCCTTCCTGAGG-3 ' (SEQ ID NO: 54) 

30 

Die PCR erfolgt in einem 50 ^1 Reaktionsansatz in dem enthalten 
sind: 

2 \ll (200 ng) genomische DNA von E.coli 
0,2 mM dATP, dTTP, dGTP, dCTP 
35 - 1,5 mM Mg(0Ac) 2 

5 |Xg Rinder serum- Albumin 

40 pmol Primer w codA5 ' EcoRI" 

40 pmol Primer * codA3 ' BamHI " 

15 |il 3,3X rTth DNA Polymerase XLPuffer (PE Applied 
40 Biosystems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 
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Die PCR wird unter folgenden Zyklus Bedingungen durchgef iihrt : 

Schritt 1: 5 Minuten 94°C (Denaturierung) 

Schritt 2: 3 Sekunden 94°C 

5 Schritt 3: 1 Minute 60°C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 



3 0 Wiederholungen der Schritte 2 bis 4 

10 Schritt 5: 10 Minuten 72°C (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 



Das Amplifikat (codARNAi-anti; SEQ ID NO: 52) wird unter Ver- 
wendung von Standardmethoden in den PCR Klonierungsvektor pGEM-T 
15 (Promega) kloniert . Die Identitat des erzeugten Amplikons wird 
durch Sequenzierung unter Verwendung des M13F (-40) Primers 
bestatigt . 

Beispiel 2 Herstellung des transgenen Expressionsverktors 
20 zur Expression einer codA doppelstrangigen RNA 

Die in Beispiel 1 generierten codA-Fragmente werden zur Her- 
stellung eines DNA Konstruktes geeignet zur Expression einer 
doppelstrangigen codA-RNA verwendet (pSUN-codA-RNAi) . Das 

25 Konstrukt ist geeignet zur Reduktion der RNA Fliefigleichgewichts- 
menge (RNA-stady state level) des codA Gens in transgenen 
Pf lanzen und einer daraus resultierenden Unterdriickung der 
Expression des codA Gens unter Verwendung der „doublestrand RNA 
interference w (dsRNAi) Technologies Die codA RNAi Kassette wird 

30 dazu zunachst in dem Plasmid pBluKS-nitP-STLSl-35S-T aufgebaut 

und anschliefeend in einem weiteren Klonierungsschritt vollstandig 
in das pSUN-1 Plasmid uberfiihrt . 

Der Vektor pBluKS-nitP-STLSl-35S-T (SEQ ID NO: 55) ist ein 
35 Derivat des pBluescript KS (Stratagene) und enthalt den Promotor 
des Nitrilasel-Gens aus A.thaliana (GenBank Acc.-No.: Y07648.2, 
Nukleotide 2456 bis 4340, Hillebrand et al . (1996) Gene 
170:197-200), das STLS-1 Intron (Vancanneyt GF et al . (1990) Mol 
Gen Genet 220 (2) : 245-250) , Restriktionsschnittstellen die das 
40 Intron an der 5'- bzw. 3'-Seite flankieren und eine gerichtete 
Insertion von DNA Fragmenten ermoglichen, sowie den Terminator 
des 35S CaMV Gens (Blumenkohlmosaikvirus ; Franck et al. (1980) 
Cell 21:285-294). Unter Verwendung dieser Restriktionsschnitt- 
stellen (Hindlll, Sail, EcoRI, BamHI) werden die Fragmente codAR- 
45 NAi-sense (SEQ ID NO: 49) und codARNAi-anti (SEQ ID NO: 52) in 
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diesen Vektor inseriert, wodurch die fertige codA RNAi Kassette 
entsteht . 

Zu diesem Zweck wird zunachst das codA-sense Fragment (codARNAi- 
5 sense SEQ ID NO: 49) unter Verwendung der Enzyme Hindlll und Sail 
aus dem pGEM-T Vektor herausgeschnitten, isoliert und in den 
pBluKS-nitP-STLSl-35S-T Vektor unter Standardbedingungen ligiert . 
Dieser Vektor wurde im Vorfeld unter Verwendung der Restriktions- 
enzyme Hindlll und Sail geschnitten. Entsprechend positive Klone 
10 werden durch analytischen Restriktionsverdau und Sequenzierung 
identif iziert . 

Der entstandene Vektor (pBluKS-nitP-codAsense-STLSl-35S-T) wird 
unter Verwendung der Restriktionsenzyme BamHI und EcoRI verdaut . 

15 Das codA-anti Fragment (codARNAi-anti; SEQ ID NO: 52) wird aus 
dem entsprechenden pGEM-T Vektor mit BamHI und EcoRI heraus- 
geschnitten, isoliert und in den geschnittenen Vektor unter 
Standardbedingungen ligiert. Entsprechend positive Klone, welche 
die vollstandige codA-RNAi Kassette enthalten (pBluKS-nitP- 

20 codAsense-STLSl-codAanti-35S-T) , werden durch analytischen 
Restriktionsverdau und Sequenzierung identif iziert . 

Der Transfer der codA-RNAi Kassette in den pSUN-1 Vektor 
(SEQ ID NO: 56) erfolgt unter Verwendung der die Kassette 

25 f lankierenden Restriktionsschnitt-stellen SacI und Kpnl . Der 

entstandene Vektor pSUNl-codA-RNAi (siehe Fig. 7; SEQ ID NO: 57) 
wird zur Transformation von transgenen A. thaliana Pflanzen 
verwendet, die ein aktives codA Gen exprimieren (s.u.). Der 
Pflanzenexpressions-Vektor pSUN-1 ist im Rahmen des erfindungs- 

30 gemafcen Verfahrens besonders geeignet, da er keinen weiteren 
positiven Selektionsmarker tragt. 

Der entstandene Vektor pSUNl-codA-RNAi ermoglicht die konsti- 
tutive Expression einer artif iziellen codA-dsRNA Variante, 

35 bestehend aus zwei identischen Nukleinsaureelementen, die durch 
ein Intron getrennt, in invertierter Form zueinander vorliegen. 
In Folge der Transkription dieser artif iziellen codA-dsRNA 
Variante kommt es aufgrund der Komplementaritat der invert iert en 
Nukleinsaureelemente zur Ausbildung eines doppelstrangigen RNA 

40 Molekuls. Das Vorhandensein dieses Molekuls induziert die Unter- 
druckung der Expression (RNA Akkumulation) des codA Gens mittels 
/7 double strand RNA interference^. 
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Beispiel 4: Herstellung transgener Arabidopis thaliana Pflanzen 

Transgene Arabidopsis thaliana Pflanzen, die als Markerprotein 
das codA Gen aus E.coli transgen exprimieren ( "A. thaliana- 
5 [codA]"), warden hergestellt wie beschrieben (Kirik et al . (2000) 
EMBO J 19 (20) :5562-6) . 

Die A. thaliana- [codA] Pflanzen werden mit einem Agrobacterium 
tumefaciens Stamm (GV3101 [pMP90] ) auf Grundlage einer modifi- 

10 zierten Vakuuminf iltrationsmethode trans formiert (Clough S & Bent 
A (1998) Plant J 16 (6) :735-43; Bechtold N et al . (1993) CR Acad 
Sci Paris 1144 ( 2 ): 204-212 ) . Die verwendeten Agrobacterium tume- 
faciens Zellen werden im Vorfeld mit deia beschriebenen DNA— 
Konstrukt (pSUNl-codA-RNAi) transf ormiert . Auf diese Art werden 

15 doppelt-transgene A, thaliana- [codA] Pflanzen erzeugt, die unter 
Kontrolle des konstitutiven Nitrilasel-Promotors eine arti- 
fizielle codA-doppelstrangige RNA exprimieren. Als Folge des 
durch die Anwesenheit dieser artif iziellen codA-dsRNA induzierten 
dsRNAi-Ef fektes wird die Expression des codA Gens unterdruckt . 

20 Diese doppelt-transgenen Pflanzen konnen aufgrund ihrer wieder- 
gewonnen Fahigkeit, in Anwesenheit von 5-Fluorocytosin im Kultur- 
medium zu wachsen, identif iziert werden. 

Samen der Primartransf ormanden werden auf Grundlage der wieder- 
25 gewonnenen Fahigkeit in Anwesenheit von 5-Fluorcytosin zu wachsen 
selektioniert . Zu diesem Zweck werden die Tl Samen der Primar- 
transf ormanden auf Selektionsmedium ausgelegt welches 200 ^ig/ml 
5-Fluorocytosin enthalt. Diese Selektionsplatten werden unter 
Langtagbedingungen (16 Std. Licht, 21°C/8 Std. Dunkel, 18°C) inku- 
30 biert. Keimlinge, die sich in Anwesenheit von 5-Flourocytosin 
normal entwickeln, werden nach 7 Tagen separiert und auf neue 
Selektionsplatten transf eriert . Diese Platten werden bei unver- 
anderten Bedingungen fur weitere 14 inkubiert. AnschlieSend 
werden die resistenten Keimlinge in Erde pikiert und unter Kurz- 
35 tagbedingungen (8 Std. Licht, 21°C/16 Std. Dunkel, 18°C) kulti- 
viert. Nach 14 Tagen werden die jungen Pflanzen in das Gew&chs- 
haus transf eriert und unter Kurztagbedingungen kultiviert. 
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Beispiel 5: Herstellung eines Pf lanzentransf ormationsvektors ent- 
haltend eine Expressions-kassette zur Expression 
einer doppelstr&ngigen codA RNA und eines pflanz- 
lichen Selektions-markers 

5 

In den pSUNl-codA-RNAi (siehe Fig. 7; SEQ ID NO: 57) wird ein 
pflanzlicher Selektionsmarker bestetiend aus einer mutierten 
Variante des A.thaliana Als-Gens kodierend fur die Acetolactat - 
Synthase unter Kontrolle des Promotor des A.thaliana Actin-2 Gens 

10 (Meagher RB & Williamson RE (1994) The plant cytoskeleton. 

In The Plant Cytoskeleton (Meyerowitz, E. & Somerville, C, eds) , 
pp. 1049-1084. Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York) und des Terminators der Octopin-Synthase (GIE- 
LEN J et al.(1984) EMBO J 3:835-846) eingefugt (At . Act . -2 -At . Als- 

15 R-ocsT) . 

Dazu wird der Vektor pSUNl-codA-RNAi zunachst mit dem Restrikti- 
onsenzym Pvu II linearisiert . In diesen linearisierten Vektor er- 
folgt anschliefcend unter Standardbedingungen die Ligation eines 

20 linearen DNA Fragmentes mit stumpfen Enden, kodierend fur eine 
mutierte Variante der Acetolactat-Synthase (Als-R-Gen) . Dieses 
DNA Fragment wurde im Vorfeld der Ligation mit dem Restriktions- 
enzym Kpnl verdaut und die uberhangenden Enden durch eine Behand- 
lung mit der Pwo DNA-Polymerase (Roche) gemafc der Herstellervor- 

25 gaben in stumpfe Enden uberfuhrt. Diese mutierte Variante des Als 
Gens aus A.thaliana kann nicht durch Herbizide des Imidazolinon- 
Typs inhibiert werden. Durch Expression dieses mutierten A.tAls-R 
Gens erlangen die Pflanzen die Fahigkeit, in Anwesenheit des Her- 
bizides Pursiut™ zu wachsen. Entsprechend positive Klone 

30 (pSUNl-codA-RNAi-At .Act. -2 -At . Als-R-ocsT; SEQ ID NO: 57) werden 
durch analytischen Restriktionsverdau und Sequenzierung identifi- 
ziert . 

Der entstandene Vektor ermoglicht die konstitutive Expression 
35 einer artif iziellen codA RNA Variante (bestehend aus zwei identi- 
schen Nukleinsaureelementen, die durch ein Intron getrennt, in 
invertierter Form zueinander vorliegen) und einer mutierten 
Variante des A.thaliana Als-Gens. In Folge der Transkription 
dieser artif iziellen codA RNA Variante kommt es aufgrund der 
40 Komplementaritat der invertierten Nukleinsaureelemente zur Aus- 
bildung eines doppelstrangigen RNA Molekuls . Das Vorhandensein 
dieses Molekuls induziert die Unterdruckung der Expression (RNA 
Akkumulation) des codA Gens mittels "double strand RNA inter- 
ference" . Die Expression des Als-R Gens vermittelt den Pflanzen 
45 die Fahigkeit, in Anwesenheit von Herbiziden des imidazolinon- 
Typs zu wachsen. 
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Beispiel 6 : Herstellung transgener Arabidopis thaliana Pf lanzen 

Transgene Arabidopsis thaliana Pflanzen, die als Markerprotein 
das codA Gen aus E.coli exprimieren ( "A. thaliana- [codA] ") , wurden 
5 wie beschrieben (Kirik et al.(2000) EMBO J 19 (20 ): 5562-6 ) herge- 
stellt . 

Die A, thaliana- [codA] Pf lanzen werden mit einem Agrobacterium 
tumefaciens Stamm (GV3101 [pMP90] ) auf Grundlage einer modif i- 

10 zierten Vakuuminf iltrationsmethode transf ormiert (Clough S & Bent 
A (1998) Plant J 16 ( 6 ) : 735-43 ; Bechtold N et al. (1993) CR Acad 
Sci Paris 1144 (2) :204-212) . Die verwendeten Agrobacterium tume- 
faciens Zellen werden im Vorfeld mit dem beschriebenen DNA-Kon- 
strukt .(pSUNl-codA-RNAi-At .Act.-2-At .Als-R-ocsT; SEQ ID NO: 57) 

15 transf ormiert. Auf diese Art werden doppelttransgene A. tha- 
liana- [codA] Pf lanzen erzeugt, die zusatzlich unter Kontrolle 
des konstitutiven Nitrilasel-Promotors eine artifizielle codA 
doppelstrangige RNA und eine Herbizid insensitive Variante des 
Als-Gens (Als-R) exprimieren (A. thaliana- [codA] - [codA-RNAi- 

20 At.Act.-2-At .Als-R-ocsT] ) . Als Folge des durch die Anwesenheit 
dieser artif iziellen codA-dsRNA induzierten dsRNAi-Ef f ektes wird 
die Expression des codA Gens unterdruckt . Diese doppelttransgenen 
Pf lanzen konnen aufgrund ihrer wiedergewonnen Fahigkeit, in An- 
wesenheit von 5-Flourocytosin im Kulturmedium zu wachsen, identi- 

25 fiziert werden. Zusatzlich konnen positiv trans formierte Pf lanzen 
aufgrund ihrer Fahigkeit, in Anwesenheit des Herbizides Pursuit 
im Kulturmedium zu wachsen, selektioniert werden. 

Zum Zweck der Selektion werden daher die Tl Samen der Primar- 
30 trans formanden auf Selektionsmedium ausgelegt welches 100 |i.g/ml 
5-Fluorocytosin enthalt . Diese Selektionsplatten werden unter 
Langtagbedingungen (16 Std. Licht, 21°C/8 Std. Dunkel, 18°C) inku- 
biert. Keimlinge, die sich in Anwesenheit von 5-Flourocytosin 
normal entwickeln, werden nach 28 Tagen separiert und auf neue 
35 Selektionsplatten transf eriert . Diese Platten werden bei unver- 
anderten Bedingungen fur weitere 14 Tage inkubiert. AnschlieSend 
werden die resistenten Keimlinge in Erde pikiert und unter Kurz- 
tagbedingungen (8 std. Licht, 21°C/16 Std. Dunkel, 18°C) kulti- 
viert. Nach weiteren 14 Tagen werden die jungen Pf lanzen in das 
40 Gewachshaus transf eriert und unter Kurztagbedingungen kultiviert . 

Zusatzlich konnen Samen der Primartrans formanden - aufgriind ihrer 
Fahigkeit in Anwesenheit des Herbizides Pursiut™ zu wachsen - 
selektioniert werden. Es ist weiterhin moglich, eine Doppel- 
45 selektion unter Verwendung des Herbizides Pursiut™ und 5-Fluor- 
cytosin im Selektionsmedixna durchzuf iihren . Zu diesem Zweck werden 
die Tl Samen der Primartrans formanden auf Selektionsmedium ausge- 
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legt welches das Herbizid Pursuit™ in einer Konzentration von 
100 nM enthalt (im Falle der Doppelselektion ist ebenfalls 
100 Jig/ml 5-Fluorocytosin enthalten) . Diese Selektionsplatten 
werden unter Langtagbedingungen (16 Std. Licht, 21°C/8 Std. 
5 Dunkel, 18°C) inkubiert. 

Keimlinge, die sich in Anwesenheit von Pursuit™ (Pursiut™ und 
5-Fluorocytosin) normal entwickeln, werden nach 28 Tagen sepa- 
riert und auf neue Selektionsplatten transf eriert . Diese Platten 

10 werden bei unveranderten Bedingungen ftlr weitere 14 Tage inku- 
biert. AnschlieSend werden die resistenten Keimlinge in Erde 
pikiert und unter Kurztagbedingungen (8 std. Licht, 21°C/16 Std. 
Dunkel, 18°C) kultiviert. Nach 14 Tagen werden die jungen Pflanzen 
in das Gewachshaus transf eriert und unter Kurztagbedingungen 

15 kultiviert. 

Beispiel 7: Analyse der unter Verwendung von 5-Fluorocytosin 

und/ oder Pursuit selektionierten doppelttransgenen 
A.thaliana Pflanzen (A. thaliana- [codA] - [codA-RNAi- 
20 At.Act.-2-At.Als-R-ocsT] ) 

Die Integration der T-DNA Region des zur Transformation ver- 
wendeten Vektors pSUNl-codA-RNAi-A. tAls-R in die genomische DNA 
der Ausgangspflanze (A. thaliana- [codA] ) und der Verlust der codA 
25 spezifischen mRNA in diesen transgenen Pflanzen (A.thaliana- 

[coc3A]-[codA-RNAi- At . Act . -2-At . Als-R-ocsT] ) kann unter Anwendung 
von Southern-Analysen und PCR Techniken bzw. Northern-Analysen 
nachgewiesen werden. 

30 Urn diese Analysen durchzufuhren wird gesamt RNA und DNA (unter 
Verwendung des RNeasy Maxi Kit (RNA) bzw. Dneasy Plant Maxi Kit 
(genomische DNA) gemaS Herstellerangaben von Qiagen) aus Blatt- 
gewebe der transgenen Pflanzen und geeigneter Kontrollen iso- 
liert . 

35 Bei den PCR Analysen kann die genomische DNA direkt als Grundlage 
(Template) der PCR verwendet werden. Die gesamt-RNA wird im 
Vorfeld der PCR in cDNA umgeschrieben. Die cDNA Synthese erfolgt 
unter Verwendung der Reversen Transkriptase Superscript II 
(Invitrogen) gemafc der Herstellerangaben. 

40 
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Beispiel 8: Nachweis der Reduktion der codA RNA Fleifcgleichge- 
wichtsmenge in den positiv selektionierten doppelt- 
transgenen Pflanzen (A.thaliana [codA] - [codA-RNAi- 
At.Act.-2-At.Als-R-ocsT] ) im Vergleich zu den zur 
5 Transformation verwendeten Ausgangspf lanzen (A.tha- 

liana [codA] ) durch cDNA Synthese mit anschliefcender 
PCR Amplif ikation. 

PCR Amplif ikation der codA spezifischen cDNA: 
10 Die cDNA des codA Gens (ACCESSION S56903) kann unter Verwendung 
eines sense spezifischen Primers (codA5 ' C-term SEQ ID NO: 69) und 
eines antisense spezifischen Primers ( codA3 ' C-term SEQ ID NO: 70) 
amplif iziert werden. Zu wahlende PCR Bedingungen sind die folgen- 
den: 

Die PCR erfolgte in einem 50 |Xl Reaktionsansatz in dem enthalten 
ist : 

2|Xl (200ng)cDNA aus A.thaliana -[codA] bzw. A.thaliana 
[codA] - [codA-RNAi-At . Act . -2-At . Als-R-ocsT] -Pflanzen 
0,2 mM dATP, dTTP, dGTP, dCTP 
1,5 mM Mg(OAc) 2 
5 |Xg Rinderserum-Albumin 
40 pmol codAS' C-term SEQ ID NO: 69 
40 pmol codA3' C-term SEQ ID NO: 70 

15 |Lll 3,3x rTth DNA Polymerase XLPuffer (PE Applied Bio- 
systems) 

5U rTth DNA Polymerase XL (PE Applied Biosys terns) 

30 Die PCR wurde unter folgenden Zyklus Bedingungen durchgef uhrt : 
Schritt 1: 5 Minuten 94°C (Denaturierung) 
Schritt 2: 3 Sekunden 94°C 
Schritt 3: 1 Minute 56°C (Annealing) 
Schritt 4: 2 Minuten 72°C (Elongation) 
30 Wiederholungen der Schritte 2 bis 4 
Schritt 5: 10 Minuten 72°C (Post-Elongation) 
Schritt 6: 4°C (Warteschleif e) 

In den positiv selektionierten Pflanzen ist die mRNA Fliefc- 
gleichgewichtsmenge des codA Gens und die daraus resultierende 

40 Menge an CODA-Proteins derart reduziert, dass eine quantitative 
Umsetzung von 5-Fluorocytosin zu 5-Fluorouracil nicht mehr er- 
folgen kann. Die Folge ist, dass diese Pflanzen (im Gegensatz zu 
den nicht transf ormierten Pflanzen) in Anwesenheit von 5-Fluoro- 
cytosin wachsen konnen. Somit wird nachgewiesen, dass transgene 

45 pflanzen aufgrund des angewendeten Prinzips der Verhinderung der 
Expression eines negativen Selektionsmarkers identif iziert werden 
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konnen . 

Beispiel 9: Nachweis der far die codA-RNAi kodierenden DNA unter 
Verwendung genomischer DNA der positiv selektionier- 
5 ten doppelttransgenen Pflanzen (A.thaliana 

[ codA] - [codA-RNAi- At . Act . -2-At . Als-R-ocsT] ) 

Das codA-RNAi Transgen kann unter Verwendung eines codA spezi- 
fischen Primers (z.B codA5 'Hindlll SEQ ID NO: 50) und eines 35s- 

10 Terminator spezifischen Primers amplifiziert (35sT 5' Primer SEQ 
ID NO: 71) werden. Durch Verwendung dieser Primerkombination kann 
spezifisch nur die fur das codA RNAi Konstrukt codierende DNA 
nachgewiesen werden, da das codA Gen, welches in den zur Trans- 
formation verwendeten Ausgangspf lanzen (A.thaliana [codA]) be- 

15 reits vorhanden war, durch den no s -Terminator flankiert wird. 

Zu wahlende PCR Bedingungen sind die folgenden: 

Die PCR erfolgte in einem 50 pi Reaktionsansatz in dem enthalten 



ist : 



20 



2 \ll (200ng) genomische DNA ^us den A.thaliana [codA] - [codA- 
RNAi -At . Act . -2 -At . Als-R-ocsT] -Pflanzen 
0,2 mM dATP, dTTP, dGTP, dCTP 
1,5 mM Mg(OAc) 2 
- 5 |lg Rinderserum-Albumin 
25 - 40 pmol codA spezifischer sense Primer (SEQ ID NO: 50, 53 
Oder 69) 

40 pmol 35sT 5' Primer SEQ ID NO: 71 

15 \ll 3,3x rTth DNA Polymerase XLPuffer (PE Applied Bio- 
systems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 



30 



Die PCR wurde unter folgenden Zyklus Bedingungen durchgefuhrt : 
Schritt 1: 5 Minuten 94°C (Denaturierung) 
Schritt 2: 3 Sekunden 94°C 
35 Schritt 3: 1 Minute 56°C (Annealing) 
Schritt 4: 2 Minuten 72°C (Elongation) 
30 Wiederholungen der Schritte 2-4 
Schritt 5: 10 Minuten 72 °C (Post-Elongation) 
Schritt 6: 4°C (Warteschleif e) 

40 

In den positiv selektionierten Pflanzen kann auf diesem Weg die 
Integration des codA-RNAi DNA Konstruktes in die chromosomale DNA 
der zur Transformation verwendeten Ausgangspf lanzen nachgewiesen 
werden. Somit wird nachgewiesen, dass transgene Pflanzen aufgrund 
* 5 des angewendeten Prinzips der Verhinderung der Expression eines 
negativen Selektionsmarkers identif iziert werden konnen. 
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Beispiel 10: Nachweis der Reduktion der codA RNA FleiSgleich- 

gewichtsmenge in den positiv selektionierten doppelt- 
transgenen Pflanzen (A.thaliana [codA] - [codA-RNAi- 
At.Act .-2-At.Als-R-ocsT] ) im Vergleich zu den zur 
Transformation verwendeten Ausgangspf lanzen (A.tha- 
liana [codA]) durch Northern-Analyse. 



25 



Gelelektrophoretische Auftrennung von RNA: 

10 Es wird pro RNA-Agarosegel 3 g Agar in 150 ml H 2 0 (f .c. 1,5 % 
(w/v) ) in der Mikrowelle gelost und auf 60°C abgekuhlt. Durch 
Zugabe von 20 ml lOx MEN (0,2 M MOPS, 50 mM Natriumacetat , 10 mM 
EDTA) und 30 ml Formaldehyd (f.c. 2,2 M) tritt weitere Abkuhlung 
ein, so dass die gut gemischte Losung zugig gegossen werden muss. 

15 Formaldehyd verhindert die Bildung von Sekundarstrukturen in der 
RNA, deshalb ist die Lauf geschwindigkeit dem Molekulargewicht 
annahernd proportional (LEHRBACH H et al. (1977) Biochem J 16: 
4743-4751) . Die RNA-Proben werden vor Auftrag auf das Gel in 
folgendem Ansatz denaturiert: 20 ]Xl RNA (1-2 tig/Jill) , 5 \ll lOx MEN- 
Puffer, 6 JJLI Formaldehyd, 20 |ll Formamid. 

^ u 

Der Ansatz wird gemischt und 10 Minuten bei 65°C inkubiert. Nach 
Zugabe von 1/10 Volumen Probenpuffer und 1 JllI Ethidiumbromid 
(10 mg/ml) wird die Probe aufgetragen. Die Gelelektrophorese 
erfolgt auf horizontalen Gelen in Ix MEN bei 120 V fur zwei bis 
drei Stunden. Nach der Elektrophorese wird das Gel unter UV-Licht 
unter Zuhilfenahme eines Lineals zur spateren Fragmentlangen- 
bestimmung photographiert . Es folgt der RNA-Blot auf eine 
Nylonmembran gemafc der Angaben in: SAMBROOK J et al. Molecular 
cloning: A laboratory manual . Cold Spring Harbor, New York, 
Cold Spring Harbor Laboratory Press. 1989. 

Radioaktive Markierung von DNA-Fragmenten und Nothern Hybridi- 
sierung 

Zur Markierung des codA cDNA Fragmentes (codARNAi-sense SEQ ID 
No: 49) kann z.B der von Roche Diagnostics vertriebene High 
Prime Kit verwendet werden. Der "High prime" Kit basiert auf der 
von Feinberg und Vogelstein ursprunglich beschriebenen "random 
primed" Methode zur DNA Markierung. Zur Markierung werden ca. 
25 ng DNA in 9-11 |Xl H20 fttr 10 min. bei 95°C denaturiert. Nach 
kurzer Inkubation auf Eis werden 4 \il High Prime Losung (enthalt 
eine random primer Mischung, 4 Einheiten Klenow Polymerase und 
jeweils 0,125 mM dATP, dTTP und dGTP in einem Reaktions-Puf f er 
mit 50 % Glycerinanteil) und 3-5 Jll [a32P]dCTP (30-50 |^lCi) hinzu- 
gegeben. Der Ansatz wird fur mindestens 10 min bei 37°C inkubiert 
und das nicht eingebaute dCTP anschlieSend von der nunmehr radio- 
aktiv markierten DNA durch Gelf iltration tiber eine Sephadex 



30 



35 



40 



45 



WO 2004/013333 PCT/EP2003/007877 

G-50-SSule getrennt. AnschlieEend wird das Fragment 10 min bei 
95°C denaturiert und bis zur Verwendung auf Eis gehalten. Es 
werden folgende Hybridisierungs- und Vorinkubationspuf f er be- 
nutzt : 

5 

Hypo Hybond 

250 mM Natriumphosphat-Puf fer pH 7,2 
1 mM EDTA 
7 % SDS (g/v) 
10 250 mM NaCl 

10 fig/ml ssDNA 

5 % Polyethylenglykol (PEG) 6000 
40 % Formamid 

15 Bei Verwendung von Hypo Hybond betragt die Hybridisierungs- 

temperatur 42 °C, die Hybridisierungsdauer 16-24 Std. Zum Waschen 
der RNA-Filter werden cirei verschiedene Losungen verwendet 2 x 
SSC (300 mM NaCl; 30 mM NaCitrat) + 0,1% SDS, 1 x SSC + 0,1 % SDS 
und 0,1 x SSC + 0,1 % SDS. Die Lange und Intensitat des Waschens 

20 richtet sich nach der Starke der gebundenen Aktivitat. Im An- 
schluss an das Waschen werden die Filter in Plastikfolie ein- 
geschweiSt und ein Rontgenfilm (X-OMat, Kodak) bei -70 0C liber 
Nacht exponiert. Die Signalstarke auf den Rontgenf ilmen ist ein 
MaS fur die Menge der codA mRNA Molekiile in der auf den Membranen 

25 gebundenen gesamt RNA. In den positiv selektionierten Pflanzen 
kann somit die Reduktion der codA mRNA im Vergleich zu den zur 
Transformation verwendet en Ausgangspf lanzen nachgewiesen werden. 

In den positiv selektionierten Pflanzen ist die mRNA Fliefi- 
30 gleichgewichtsmenge des codA Gens und die resultierende Menge 
an gebildeten CODA- Proteins derart reduziert, dass eine quanti- 
tative Umsetzung von 5-Fluorocytosin zu 5-Fluorouracil nicht 
mehr erfolgen kann. Die Folge ist, dass diese Pflanzen (im Gegen- 
satz zu den nicht transf ormierten Pflanzen) in Anwesenheit von 
35 5-Fluorocytosin wachsen konnen. Somit wird nachgewiesen, dass 
transgene Pflanzen aufgrund des angewendeten Prinzips der Ver- 
hinderung der Expression eines negativen Selektionsmarkers iden- 
tifiziert werden konnen. 

40 Beispiel 11: Zusammenf assung der Ergebnisse der "Negativ-Negativ" 

Selektion 

Die Transformation der codA-transgenen Arabidopsis Pflanzen mit 
dem codA— ds RNA Konstrukt (pSUNl-codA-RNAi-At . Act . -2-At . Als- 
45 R-ocsT; SEQ ID NO: 57) fuhrt sowohl bei der Einf ach-Selektion 
(nut mit 5-Fluorcytosin) als auch bei der Doppel-Selektion 
(Pursiut™ und 5-Fluorcytosin) zu einer signifikant erhohten 
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Arizahl von doppelt-transgene Pf lanzen, die das RNAi-Konstrukt 
erfolgreich in das Genom integriert haben (jeweils im Vergleich 
zu nicht trans formier ten Pf lanzen) . Die Analyse mittels PCR 
(s.o.) bestatigt bei der Mehrzahl der so generierten Pf lanzen 
5 den doppelt transgenen Status . Damit kann erfolgreich die Prakti- 
kabilitat der vorliegenden Erfindung d.h. die Nutzbarkeit der 
Repression eines negativen Markers zur positiven Selektion (quasi 
eine "negativ-negativ" Selektion) gezeigt werden. 
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Patentanspruche 

1. Verfahren zur Herstellung transf ormierter pflanzlicher Zellen 
5 oder Organismen umfassend nachf olgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, 
wobei die Zellen besagter Population mindestens ein 
Markerprotein enthalten, das fur besagte Population 

10 direkt oder indirekt einen toxischen Effekt bewir ken 

kann, mit mindestens einer zu insertierenden Nuklein- 
sauresequenz in Kombination mit mindestens einer Ver- 
bindung befahigt zur Verminderung der Expression, Menge, 
Aktivitat und/oder Funktion mindestens eines Marker- 

15 proteins, und 

b) Selektion von transf ormierten pf lanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
inf olge der Wirkung besagter Verbindung gegeniiber nicht- 

20 transf ormierten Zellen einen Wachstumsvorteil haben, 

aus besagter Population pflanzlicher Zellen, wobei die 
Selektion unter Bedingungen durchgefiihrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
transf ormierten Zellen ausiiben kann. 

25 

2 . Verfahren nach Anspruch 1 , wobei das Markerprotein in der 
Lage ist, eine fur besagte Population pflanzlicher Zellen 
nicht-toxische Substanz X in eine fur besagte Population 
toxische Substanz Y direkt oder indirekt umzusetzen, 
30 umfassend nachf olgende Schritte: 

a) Transformation der Population pflanzlicher Zellen mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 
Kombination mit mindestens einer Verbindung befahigt zur 

35 Verminderung der Expression, Menge, Aktivitat und/oder 

Funktion mindestens eines Markerproteins , und 

b) Behandlung besagter Population pflanzlicher Zellen mit 
der Substanz X in einer Konzentration, die infolge der 

40 Umsetzung durch das Markerprotein einen fur nicht-trans- 

formierte Zellen toxischen Effekt bedingt, und 

c) Selektion von transf ormierten pf lanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 

45 infolge der Wirkung besagter Verbindung gegeniiber nicht- 

transf ormierten Zellen einen Wachstumsvorteil haben, 
aus besagter Population pflanzlicher Zellen, wobei die 



WO 2004/013333 PCT/EP2003/007877 



Selektion unter Bedingungen durchgefuhrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
transformierten Zellen ausiiben kann. 



3. Verfahren nach Anspruch 2, wobei es sich bei der nicht- 
toxischen Substanz X urn eine Substanz handelt, die nattir- 
licherweise in pf lanzlichen Zellen oder Organismen nicht oder 
nur in Konzentration vorkommt, die im wesentlichen keinen 
toxischen Effekt bewirken konnen. 

4. Verfahren nach Anspruch 2 oder 3, wobei es sich bei der 
Substanz X uin eine Substanz handelt ausgewahlt aus der Gruppe 
bestehend aus Pro-Herbiziden, Pro-Antibiotika, Nukleosid- 
analoga, 5-Fluorocytosin, Auxinamidverbindungen, Naphthal- 
acetamid, Dihaloalkanen, Acyclovir, Ganciclovir, l,2-Deoxy-2- 
fluoro-p-D-arabinofuranosil-5-iodouracil, 6-Thioxanthin, 
Allopurinol , 6-Methylpurindeoxyribonukleosid, 4 -Ami no - 
pyrazolopyrimidin, 2-Amino-4-methoxy-butansaure , 5- (Tri- 

f luoromethyl) thioribose und Allylalkohol . 

5. Verfahren nach einem der Anspruche 1 bis 4, wobei das Marker- 
protein ausgewahlt ist aus der Gruppe bestehend aus Cytosin- 
deaminasen, Cytochrom P-450 Enyzmen, Indoles sigsaurehydro- 
las en, Haloalkandehalogenasen, Thymidinkinasen, Guaninphos- 
phor ibosyl trans f erasen , Hypoxanthinphosphoribosyltrans- 
ferasen, Xanthinguaninphosphoribosyltransf erasen, Purin- 
nukleosidphosphorylasen, Phosphonatmonoesterhydrolasen, 
Indolacetainidsynthasen, Indolacetamidhydrolasen, Adenin- 
phosphor ibosyl trans ferasen, Methoxinindehydrogenasen, 
Rhizobitoxinsynthasen, 5-Methylthioribosekinasen und Alkohol- 
dehydrogenasen . 

6. Verfahren nach einem der Anspruche 1 bis 5, wobei das Marker- 
protein kodiert wird durch 

a) eine Sequenz beschrieben durch die GenBank Accession- 
Nummer S56903, M32238, NC003308, AE009419, AB016260, 
NC002147 M26950, J02224, V00470, V00467, U10247, M13422, 
X00221, M60917, U44852, M61151, AF039169, AB025110, 
AF212863, AC079674, X77943, M12196, AF172282, X04049 
oder AF253472 

b) eine Secjuenz gemafc SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 
18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 
46 oder 48 
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7. Verfahren nach einem der Anspriiche 1 bis 6, wobei die Ver- 
bindung befahigt zur Verminderung der Expression, Menge, 
Aktivitat und/oder Funktion mindestens eines Markerproteins 
mindestens eine Nukleinsauresequenz , Ribonukleinsauresequenz, 

5 doppelstrangige Ribonukleinsauresequenz, antisense-Ribo- 

nukleinsauresequenz , Expressionskassette oder Polypeptid- 
sequenz umf asst . 

8 . Verfahren nach einem der Anspriiche 1 bis 7 , wobei die 

10 Verbindung befahigt zur Verminderung der Expression, Menge, 

Aktivitat und/oder Funktion mindestens eines Markerproteins 
ein DNA-Konstrukt ist, welches umf asst 

a) mindestens eine Expressionskassette geeignet zur 
15 Expression einer Ribonukleinsauresequenz und/oder 

gegebenenfalls eines Proteins, wobei besagte Nuklein- 
sauresequenz und/oder Protein in der Lage ist, die 
Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins zu vermindern, oder 

b) mindestens eine Sequenz /'die eine teilweise oder voll- 
standige Deletion oder Inversion der Sequenz kodierend 
fur besagtes Markerprotein bewirkt und so eine Ver- 
minderung der Expression, Menge, Aktivitat und/oder 

25 Funktion des Markerproteins ermSglicht, sowie 

_ gegebenenfalls - weitere Funktionselemente, die 
besagte Deletion oder Inversion erleichtern und/oder 
fordern, oder 

30 c) mindestens eine Sequenz, die eine Insertion in die 

Sequenz kodierend fur das Markerprotein bewirkt und 
so eine Verminderung der Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins ermoglicht, sowie 
- gegebenenfalls - weitere Funktionselemente, die besagte 

35 Insertion erleichtern und/oder fordern. 

9. Verfahren nach einem der Anspriiche 1 bis 8, wobei die Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion 
des Markerproteins durch mindestens eines der nachf olgenden 
40 Verfahren realisiert wird 

a) Einbringen mindestens einer doppelstrangigen Marker- 
protein Ribonukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette oder 
45 Expressionskassetten. 
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b) Einbringen mindestens einer Markerprotein antisense-Ribo- 
nukleinsauresequenzen oder einer deren Expression gew&hr- 
leistenden Expressionskassette . 

5 c) Einbringen mindestens einer Markerprotein antisense-Ribo- 

nukleinsauresequenze kombiniert mit einem Ribozym oder 
einer deren Expression gewahrleistenden Expressions- 
kassette oder Expressionskassetten. 

10 d) Einbringen mindestens einer Markerprotein sense-Ribo- 

nukleinsauresequenzen zur Induktion einer Kosuppression 
oder einer deren Expression gewahrleistenden Expressions- 
kassette . 

15 e ) Einbringen mindestens eines DNA-oder Protein-bindenden 

Faktors gegen ein Markerprotein-Gen, -RNA oder -Protein 
oder einer dessen Expression gewahrleistenden 
Expressionskassette . 

20 f ) Einbringen mindestens einer den Markerprotein RNA-Abbau 

bewirkenden viralen Nukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette. 

g) Einbringen mindestens eines Konstruktes zur Erzeugung 
25 einer Insertion, Deletion, Inversion oder Mutation in 

einem Markerprotein-Gen. 

10. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch das Einbringen einer 

30 sequenzspezif ischen Rekombinase realisiert wird. 

11. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch das Einbringen eines 
sequenzspezif ischen Enzyms geeignet zur Induktion von DNA- 

35 Doppelstrangbriichen realisiert wird. 

12. Verfahren nach einem der Anspruche 1 bis 11, wobei die 
Inaktivierung des Markerprotein-Gens durch Induktion einer 
intramolekularen oder intermolekularen homologen Rekombi- 

40 nation realisiert wird. 



13 . Verfahren nach Anspruch 12 , wobei die homologe Rekombination 
durch Einwirkung eines sequenzspezif ischen Enzyms geeignet 
zur Induktion von DNA-Doppelstrangbriichen gefordert wird. 
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14. Verfahren nach nach einem der Ansprtiche 1 bis 13, wobei die 

Inaktivierung des Markerproteins durch Integration einer DNA- 
Sequenz in ein Markerprotein-Gen realisiert wird, umfassend 
nachf olgende Schritte: 

i) Einbringen eines Insertionskonstruktes und mindestens 
eines Enzyms geeignet zur Induktion von DNA-Doppel- 
strangbruchen an einer Erkennungssequenz zur gezielten 
Induktion von DNA-Doppelstrangbr lichen in oder in der Nahe 
des Markerprotein-Gens, und 

ii) Induktion von DNA-Doppelstrangbruchen an den Erkennungs- 
sequenzen zur gezielten Induktion von DNA-Doppelstrang- 
bruchen in oder in der Nahe des Markerprotein-Gens, -und 

iii) Insertion des Insertionskonstruktes in das Markerprotein- 
Gen, wobei die Funktionalitat des Markerprotein-Gens und 
_ bevorzugt - die Funktionalitat der Erkennungssequenz 
zur gezielten Induktion von DNA-Doppelstrangbrttchen 
inaktiviert wird, so dass besagte Erkennungssequenz 
nicht mehr durch das Enzym geeignet zur Induktion von 
DNA-Doppelstrangbruchen geschnitten werden kann, und 

iV) Selektion von Pflanzen oder pflanzlichen Zellen, bei 
denen das Insertionskonstrukt in das Markerproteingen 
insertiert wurde. 

15. Verfahren nach einem der Anspruche 11, 13 oder 14, wobei 
das sequenzspezifische Enzym geeignet zur Induktion von DNA- 
Doppelstrangbruchen eine Homing-Endonuklease ist. 

16. Verfahren nach einem der Anspruche 1 bis 15, wobei zusammen 
mit der zu insertierenden Nukleinsauresequenz eine Sequenz 
kodierend fur eine Resistenz gegen mindestens ein Toxin, 
Antibiotikum oder Herbizid eingebracht wird, und die 
Selektion zusatzlich unter Einsatz des Toxins, Antibiotikums 
oder Herbizids erfolgt. 

17. Verfahren nach einem der Anspriiche 1 bis 16, wobei die 

in das Genom der pflanzlichen Zelle oder des pflanzlichen 
Organismus zu insertierende Nukleinsauresequenz mindestens 
eine Expressionskassette umfasst, wobei besagte Expressions- 
kassette unter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen funktionellen Promotors eine RNA 
und/oder ein Protein exprimieren kann, welche nicht die Ver- 
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minderung der Expression, Menge, Aktivitat und/oder Funktion 
eines Markerproteins bewirken. 

18. Verfahren nach einem der Ansprtiche 1 bis 17, wobei die 
pflanzliche Zelle Teil eines pflanzlichen Organismus oder 
eines davon abgeleiteten Gewebes, Teils, Organs, Zellkultur 
oder Vermehrungsmaterials ist. 

19 . Verfahren nach einem der Anspriiche 1 bis 18 zur Herstellung 
trans formierter pflanzlicher Zellen oder Organismen, , 
umfassend nachfolgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, 
welche mindestens ein nicht-endogenes (bevorzugt nicht - 
pf lanzliches) Markerprotein umfasst, das in der Lage 
ist, eine fur besagte Population pflanzlicher Zellen 
nicht-toxische Substanz X in eine fur besagte Population 
toxische Substanz Y direkt oder indirekt umzusetzen, mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 
Kombination mit mindestens einer Nukj leinsauresequenz 
kodierend fur eine Ribonukleinsauresequenz befahigt zur 
Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion besagten Markerproteins, und 

b) Behandlung besagter Population pflanzlicher Zellen mit 
der Substanz X in einer Konzentration, die infolge der 
Umsetzung durch das Markerprotein einen fur nicht-trans- 
formierte Zellen toxischen Effekt bedingt, und 

c) Selektion von trans formierten pflanzlichen Zellen 
(und/oder Populationen pflanzlicher Zellen wie pflanz- 
lichen Geweben oder Pf lanzen) , die in ihrem Genom besagte 
Nukleinsauresequenz aufweisen und die infolge der Wirkung 
besagter Verbindung gegeniiber nicht- trans formierten 
Zellen einen Wachstumsvorteil haben, aus besagter Popu- 
lation pflanzlicher Zellen, wobei die Selektion unter 
Bedingungen durchgefuhrt wird, bei denen das Marker- 
protein seinen toxischen Effekt auf die nicht- trans- 
formierten Zellen ausuben kann, und 

3) Regeneration von fertilen Pf lanzen, und 



e) 



Auskreuzung der fur das Markerprotein kodierenden 
Nukleinsauresequenz und Isolation von fertilen Pf lanzen, 
die in ihrem Genom besagte Nukleinsauresequenz aber nicht 
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mehr die fiir das Markerprotein kodierende Sequenz auf- 
weisen. 

20. Aminosauresequenzen kodieren fiir eine pflanzliche 5-Methyl- 

5 thioribosekinase, dadurch gekennzeichnet , dass besagte Amino- 

sauresequenz mindestens eine Sequenz enthalt ausgewahlt aus 
der Gruppe bestehend aus SEQ ID NO: 60, 62, 64, 66 oder 68. 

21. Nukleinsaureseguenz kodieren far eine pflanzliche 5-Methyl- 
10 thioribosekinase, dadurch gekennzeichnet, dass besagte 

Nukleinsaureseguenz mindestens eine Sequenz enthalt aus- 
gewahlt aus der Gruppe bestehend aus SEQ ID NO: 59,. 61, 63, 
65 Oder 67. 

15 22. Doppelstrangiges RNA-Molekul umfassend 

a) einen " sense "-RNA-Strang umfassend mindestens eine Ribo- 
nukleotidsequenz , die im wesentlichen identisch ist zu 
mindestens einem Teil des - sense" -RNA-Transkriptes einer 

20 Nukleinsaureseguenz kodierend fiir ein Markerprotein, und 

b) einen "antisense" -RNA-Strang, der zu dem RNA-sense-Strang 
unter a) im wesentlichen - bevorzugt vollstandig - 
komplementaren ist . 



25 



23. Doppelstrangiges RNA-Molekiil nach Anspruch 22, wobei das 
Markerprotein wie in einem der Anspriiche 2 bis 6 definiert 
ist . 

30 24. Doppelstrangiges RNA-Molekiil nach einem der Anspriiche 22 

oder 23, wobei "sense" -RNA-Strang und "antisense"-RNA-Strang 
kovalent in Form eines invertierten Repeats miteinander ver- 
bunden sind. 

35 25. Transgene Expressionskassette enthaltend in f unktioneller 
Verkniipfung mit einem in pflanz lichen Organismen funktio- 
nellen Promotor eine Nukleinsaureseguenz kodierend ftir ein 
doppelstrangiges RNA-Molekul gemaS einem der Ansprttche 22 
bis 24. 

40 

26. Transgene Expressionskassette enthaltend eine Nukleinsaure- 
seguenz kodierend far zumindest einen Teil eines Marker- 
proteins, wobei besagte Nukleinsaureseguenz mit einem in 
pflanzlichen Organismen funktionellen Promotor in antisense- 
45 Orientierung funktionell verknapft ist. 
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W m 

27. Transgene Expressionskassette nach Anspruch 26, wobei das 
Markerprotein wie in einem der Anspruche 2 bis 6 definiert 
ist . 

5 28. Transgener Vektor enthaltend eine transgene Expressions- 
kassette gemafi einem der Anspruche 25 bis 27. 

29. Transgener pflanzlicher Organismus enthaltend ein doppel- 
strangiges RNA-Mo 1 e kii 1 gemaS einem der Anspruche 22 bis 24, 

10 eine transgene Expressionskassette gemaS einem der 

Anspruche 25 bis 27 oder einen transgenen Vektor gemaS 
Anspruch 28. 

30. Transgener pflanzlicher Organismus nach Anspruch 29, aus- 
15 gewahlt aus der Gruppe der Pflanzen bestehend aus Weizen, 

Hafer, Hirse, Gerste, Roggen, Mais, Reis, Buchweizen, 
Sorghum, Triticale, Dinkel, Leinsamen, Zuckerrohr, Raps, 
Kresse, Arabidopsis, Kohlarten, Soja, Alfalfa, Erbse, Bohnen- 
gewachsen, Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, 
20 Paprika, SonnenblTjme, Tagetes, Salat, Calendula, Melone, 

Kurbis und Zucchini . 

31. Gewebe, Organ, Teil, Zelle, Zellkultur oder Vermehrungsgut 
abgeleitet von einem transgenen pf lanzlichen Organismus gemaS 

25 einem der Anspruche 29 oder 30. 
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Klebsiella pneumoniae 
Clostridium tetani . 
Zea mays 
A. thaliana 
Brassica napus-2 
Soy-1 

Oryza sativa-1 
Consensus 



1 50 

(!) MSQYHTFTAHDAVAYAQQ 

(1) MSRFDSHFRMETEDAILYAKE 

( 1 ) ARALLSSPIiAGASPDCQSASAMAAEEEQGFRPIiDESSIiLAYIKATPALAS 

(1) MSFEEFTPLNEKSLVDYIKSTPALSS 

(!) VDDFVLRAKEMSFDEFKPLNEKSLVEYIKATPALSS 

(!) 

(1) 

(1) L V A 



Klebsiella pneumoniae (19) 

Clostridium tetani. (22) 

Zea mays (51) 

A. thaliana (27) 

Brassica napus -2 (37) 

Soy -1 (1) 

Oryza sativa -1 (1) 

Consensus (51) 



51 100 
F AGIDNP SELVSAQEVGDGNLNLVFKVFDRQGV SRAI VKQALPYVRCVGE 
KLGIFDEHAKLQAEEIGDGNII^rYVFKVWDVNTKKSVIIKHADIFLRSSGR 
RIiGGGGSLDSIEIKEVGDGNLNFVYIVQSEAGA--IWKQALPYVRCVGD 
KIGADKSDDDLVIKEVGDGNLNFVFIWGSSGS--LVIKQALPYIRCIGE 
RLGDKY — DDLVIKEVGDGNLNFVF I WGSTGS — LVIKQALPYIRCIGE 



KLG 



D L 



EVGD GNLNFVF V 



LVIKQALPYIRCIGE 



Klebsiella pneumoniae (69) 

Clostridium tetani. (72) 

Zea mays (99) 

A. thaliana (75) 

Brassica napus -2 (83) 

Soy -1 (1) 

sativa -1 (1) 

Consensus (101) 



101 150 
SWPLTLDRARLEAQTLVAHYQHSPQHTV1CIHHFDPELAVMVMEDLS-DHR 
— ELDVDRNRIEAEV1jMLQGIIjAPGLVPKYYKYT)Sv14C]SII»SMEDI S - DHR 
SWPMTRERAYFEASTLREHGRLCPEHTPEVYHFDRTLSLMGMRYIEPPHI 
SWPMTKERAYFEATTLRKHGNL S PDHVPEVYHFDRTMAL I GMR YLEPPH I 
S W PMTKERAYFEATTLRKHGGIiS PDHVPEVYHFDRTMAL I GMRYLE PPH I 
IPEHVPEVYHFDRTMSLIGMRYLEPPHI 

SWPMT ERA EA TL HG LS PDHV PEVYHFDRTMAL I GMR YL E P PH I 



Klebsiella pneumoniae (118) 

Clostridium tetani. (119) 

Zea mays (149) 

A. thaliana (125) 

Brassica napus -2 (133) 

Soy -1 (29) 

Oryza sativa -1 (1) 

Consensus (151) 



151 200 
IWRGELIAlWYYPQAARQLGDYIAQVTiFHT 

NLRKELLKRNTF P S F AEHI TTF I VDTLIj PTTDLVMD S GEKKDNVKKYI N- 
I LRKGIiVAGVE YPLL ADHMS DYMAKTLFFTS LL YNNTTDHKNGV AK YS AN 
ILRKGLIAGIEYPFLADHMSDYMAKTLFFTSIiLYHDTTEHRRAVTEFCGN 

ILRKG 

ILIKGLIAGIEYPFLAEHMADFMAKTLFFTSLLFRSTADHKRDVAEFCGN 

LLYNS TTDHKKGV AQ YC DN 

ILRKGLIA I YP ADHM DYMA TLF TSLLY T DHK VA F N 



Klebsiella pneumoniae (167) 

Clostridium tetani. (168) 

Zea mays (199) 

A. thaliana (175) 

Brassica napus -2 (13 8) 
Soy -1 (79) 
Oryza sativa -1 (20) 

Consensus (201) 



201 250 
PAMCEITEDLFFNDPYQIHERN--NYPAELEADVAAL.RDDAQLKLAVAAL 
KDLCKISEDLVFTEPFIDYKSRNTVLEENIEFVKRQIiYEDKELILEAGKL 
VEMCRLTEQWFSDPYRVSKFNR-WTSPYLDKDAEAVREDDELKLEVAGIi 
VELCRLTEQWFSDPYRVSTFNR-WTSPYLDDDAKAVREDSALKLEIAEL, 

VELCRliTEQWFSDPYKVS QYNR- WTS PYLDRDAEAVREDNLLKLEVAEL 
VEMCRLTEQWFSDPYMLAKYNR-CTSPFLDNDAAAVREDAEIiKLEIAEL 
VEIiCRIiTEQWFSDPY VS FNR TSPYL.D DA AVRED LKLEVA L 
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Klebsiella pneumoniae 
Clostridium tetani . 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani . 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



300 

(215) KHRFFAHAEALLHGDIHSGSIFVAEGSLKAIDAEFGYFGPIGFDIGTAIG 

( 218 ) KNNFMNNSQALIHGDLHSGSIFVNEESTKILDPEFAFYGPIGYDliGNVIG 

(248) KSMF I ERAQALIHGDLHTGS IMVTEVQLKSLI QNLGSMGPMGFDI GSLPW 

( 224 ) KSMFCERAQALIHGDLHTGSVMVTQDSTQVIDPEFSFYGPMGFDIGAYLG 

(138) 

(12 8) KSKFIES 

( 69 ) KSMFIERAQALLHGDLHTGSIMVTPDSTQVIDPEFAFYGPMGYDIGAFLG 

(251) KS FIE AQALIHGDLHTGSI V S ID EFAFYGPMGFDIG IG 

301 350 
(265) NLLLNYCGLPGQLGIRDAAAAREQRLNDIHQLWTTF AERFQALAAEKTRD 
(268) NLFFAWANAYVTEDGKEVEEFTIWIEKTIENIIiELFKEKFIKKYKEIVTD 

(298) KPDFGHTMHRMGML IKRMI VRLTRMDLEDN 

( 274 ) NL I L AFF AQDGHATQENDRKE YKQWI LRTI EQTWNLFNKRF I ALWDQNKD 

(138) 

(135) 

(119) NL I LAYF S QDGHAD QANDRKAY 

(301) NL AY 

351 400 
(315) AALAYPGYASAFLKKVWADAVGFCGSELIRRSVGLSHVADIDTIQDDAMR 
( 318 ) VI^AKEEYYMI^YLHSIIjSDTAGQVGIjEIIRRVVGDSKVIjDITSITDINKR 

(328) 

(324) GPGEAYLADIYNNTEvXiKFVQENYMRNIjLHDSLGFGAAKMIRRIVGVAHV 

(138) 

(135) 

(141) 

(351) 

401 447 

(365) HECLRHAITLiGRAIiIVLAERIDSVDELiLiARVRQYS 

(368) VKAER I LI LSAKTF I KNRHK I KTGKRYVE I FNSNMY 

(328) 

( 374 ) EDFESIEEDKRRAICERSALEFAKMLLKERRKFKSIGEWSAIQQQS 

(138) 

(135) 

(141) 

(401) 
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1 

SEQUENZ PROTOKOLL 

<110> BASF Plant Science GmbH 

<120> Neue Selektionssysteme 

<130> PF53790-AT 

<140> 
<141> 

<160> 71 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 1284 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1) . . (1281) 

<223> coding for cytosine deaminase (codA) 
<400> 1 

gtg teg aat aac get tta caa aca att att aac gec egg tta cca ggc 
Val Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 
15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gec 9 6 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

att gat gcg caa tec ggc gtg atg ccc ata act gaa aac age ctg gat 144 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

gee gaa caa ggt tta gtt ata ccg ccg ttt gtg gag cca cat att cac 192 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

ctg gac acc acg caa acc gec gga caa ccg aac tgg aat cag tec ggc 240 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

acg ctg ttt gaa ggc att gaa cgc tgg gee gag cgc aaa gcg tta tta 288 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

acc cat gac gat gtg aaa caa cgc gca tgg caa acg ctg aaa tgg cag 33 6 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 HO 

att gee aac ggc att cag cat gtg cgt acc cat gtc gat gtt teg gat 384 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

gca acg eta act gcg ctg aaa gca atg ctg gaa gtg aag cag gaa gtc 432 
Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

gcg ccg tgg att gat ctg caa ate gtc gee ttc cct cag gaa ggg att 
Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 
Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 I 75 



480 



528 
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ggg gca gat gta gtg^R gcg att ccg cat ttt gaa ttt ac^cgt gaa 576 
^Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gec ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

gac cgt etc ate gac gtt cac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

cgc ttt gtc gaa acc gtt get gee ctg gcg cac cat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg cga gtc acc gec age cac acc acg gca atg cac tec tat aac ggg 7 68 
Ala Airg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc cgc ttg ctg aaa atg tec ggt att aac 816 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly lie Asn 
260 265 270 

ttt gtc gee aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 864 
Phe Val Ala Asn Pro Leu Val Asn lie His Leu Gin Gly Arg Phe Asp 
275 280 285 

acg tat cca aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

tec ggc att aac gtc tgc ttt ggt cac gat gat gtc ttc gat ccg tgg 9 60 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg cat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tgc cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

tta ate acc cac cac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

att gee gee gga aac age gec aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 1200 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 

ggc ggc aag gtg att gec age aca caa ccg gca caa acc acc gta tat 1248 
Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag cca gaa gec ate gat tac aaa cgt tga 12 84 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



<210> 2 
<2H> 427 
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<212> PRT 
^<213> Escherichia coli 

<400> 2 

Val Ser Asn Asn Ala Leu Gin Thr lie lie Asn Ala Arg Leu Pro Gly 
1 5 10 15 

Glu Glu Gly Leu Trp Gin lie His Leu Gin Asp Gly Lys lie Ser Ala 
20 25 30 

lie Asp Ala Gin Ser Gly Val Met Pro lie Thr Glu Asn Ser Leu Asp 
35 40 45 

Ala Glu Gin Gly Leu Val lie Pro Pro Phe Val Glu Pro His He His 
50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 110 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

Thr Tyr Pro Lys Arg Arg Gly lie Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

Ser Gly He Asn Val Cys Phe Gly His .Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 
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A # 

Leu lie Thr His His W Ala Arg Thr Leu Asn Leu Gin As^Tyr Gly 

355 360 365 

He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 

370 375 380 

Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 

Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



<210> 3 
<211> 1284 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: coding for 
cytosine deaminase (codA) 

<220> 

<221> misc_f eature 
<222> (1) . . (3) 

<223> mutation of GTG to ATG start codon for expression 
in eucaryotic hosts 

<220> 

<221> CDS 

<222> (1) . . (1281) 

<223> coding for cytosine deaminase (codA) 
<400> 3 

atg teg aat aac get tta caa aca att att aac gec egg tta cca ggc 48 
Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 

15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gee 9 6 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 

20 25 30 

att gat gcg caa tec ggc gtg atg ccc ata act gaa aac age ctg gat 144 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 

35 40 45 

gec gaa caa ggt tta gtt ata ccg ccg ttt gtg gag cca cat att cac 192 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 

50 55 60 

ctg gac ace acg caa ace gec gga caa ccg aac tgg aat cag tec ggc 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

acg ctg ttt gaa ggc att gaa cgc tgg gee gag cgc aaa gcg tta tta 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

ace cat gac gat gtg aaa caa cgc gca tgg caa acg ctg aaa tgg cag 3 36 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 

100 105 HO 

att gee aac ggc att cag cat gtg cgt acc cat gtc gat gtt teg gat 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 



240 



288 



384 



480 
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aaa gca atg ctg gaa gtg aag c3^&aa gtc 432 
•Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 

130 135 140 

gcg ccg tgg att gat ctg caa ate gtc gec ttc cct cag gaa ggg att 
Ala Pro Trp lie Asp Leu Gin lie Val Ala Phe Pro Gin Glu Gly lie 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 528 
Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

ggg gca gat gta gtg ggg gcg att ccg cat ttt gaa ttt acc cgt gaa 576 
Gly Ala Asp Val Val Gly Ala lie Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gec ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

gac cgt etc ate gac gtt cac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu lie Asp Val His Cys Asp Glu lie Asp Asp Glu Gin Ser 

210 215 220 

cgc ttt gtc gaa acc gtt get gec ctg gcg cac cat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg cga gtc acc gee age cac acc acg gca atg cac tec tat aac ggg 768 
Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc cgc ttg ctg aaa atg tec ggt att aac 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

ttt gtc gee aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 864 
Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

acg tat cca aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

tec ggc att aac gtc tgc ttt ggt cac gat gat gtc ttc gat ccg tgg 960 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg cat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tgc cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

tta ate acc cac cac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

att gee gee gga aac age gec aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 1200 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 



816 
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age aca caa ccg gca caa acc ad^fcrta tat 1248 
*Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag cca gaa gec ate gat tac aaa cgt tga 12 84 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 

<210> 4 
<211> 427 
<212> PRT 

<213> Kiinstliche Sequenz 

<223> Beschreibung der kunstlichen Sequenz: coding for 
cytosine deaminase (codA) 

<400> 4 

Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 
15 10 15 

Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 " 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 HO 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 

210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 
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Thr Tyr Pro Lys Arg Gly He Thr Arg Val Lys Glu Me^Leu Glu 

V 290 295 300 

Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 ~ 390 395 400 

Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



48 



96 



<210> 5 
<211> 1221 
<212> DNA 

<213> Streptomyces griseolus 

<220> 
<221> CDS 
<222> (1) . . (1218) 

<223> coding for cytochrome P450-Sul (suaC) 
<400> 5 

atg acc gat acc gcc acg acg ccc cag acc acg gac gca ccc gcc ttc 
Met Thr Asp Thr Ala Thr Thr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
15 10 15 

ccg age aac egg age tgt ccc tac cag tta ccg gac ggc tac gcc cag 
Pro Ser Asn Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

etc egg gac acc ccc ggc ccc ctg cac egg gtg acg etc tac gac ggc 144 
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 
35 40 45 

cgt cag gcg tgg gtg gtg acc aag cac gag gcc gcg cgc aaa ctg etc 192 
Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 
50 55 60 

ggc gac ccc egg ctg tec tec aac egg acg gac gac aac ttc ccc gcc 240 
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 ~ 70 75 80 

acg tea ccg cgc ttc gag gcc gtc egg gag age ccg cag gcg ttc ate 2 88 
Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe He 

85 90 95 

ggc ctg gac ccg ccc gag cac ggc acc egg egg egg atg acg ate age 33 6 
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr He Ser 
100 105 110 
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• # 

gag ttc acc gtc aag^fg ate aag ggc atg cgc ccc gag g^T gag gag 384 
*Glu Phe Thr Val Lys Arg He Lys Gly Met Arg Pro Glu Val Glu Glu 
115 120 125 

gtg gtg cac ggc ttc etc gac gag atg ctg gec gec ggc ccg acc gec 432 
Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala 
130 135 140 

gac ctg gtc agt cag ttc gcg ctg ccg gtg ccc tec atg gtg ate tgc 480 
Asp Leu Val Ser Gin Phe Ala Leu Pro Val Pro Ser Met Val He Cys 
145 150 155 160 

cga etc etc ggc gtg ccc tac gec gac cac gag ttc ttc cag gac gcg 528 
Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gin Asp Ala 
165 170 175 

age aag egg ctg gtg cag tec acg gac gcg cag age gcg etc acc gcg 576 
Ser Lys Arg Leu Val Gin Ser Thr Asp Ala Gin Ser Ala Leu Thr Ala 
180 185 190 

egg aac gac etc gcg ggt tac ctg gac ggc etc ate acc cag ttc cag 624 
Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu He Thr Gin Phe Gin 
195 200 205 

acc gaa ccg ggc gcg ggc ctg gtg ggc get ctg gtc gee gac cag ctg 672 
Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gin Leu 
210 215 220 

gec aac ggc gag ate gac cgt gag gaa ct<? ate tec acc gcg atg ctg 720 
Ala Asn Gly Glu He Asp Arg Glu Glu Leu He Ser Thr Ala Met Leu 
225 230 235 240 

etc etc ate gec ggc cac gag acc acg gee teg atg acc tec etc age 7 68 
Leu Leu He Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser 
245 250 255 

gtg ate acc ctg ctg gac cac ccc gag cag tac gee gee ctg cgc gee 816 
Val He Thr Leu Leu Asp His Pro Glu Gin Tyr Ala Ala Leu Arg Ala 
260 265 270 

gac cgc age etc gtg ccc ggc gcg gtg gag gaa ctg etc cgc tac etc 864 
Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu 
275 280 285 

gee ate gec gac ate gcg ggc ggc cgc gtc gec acg gcg gac ate gag 912 
Ala He Ala Asp He Ala Gly Gly Arg Val Ala Thr Ala Asp He Glu 
290 295 300 

gtc gag ggg cac etc ate egg gee ggc gag ggc gtg ate gtc gtc aac 960 
Val Glu Gly His Leu He Arg Ala Gly Glu Gly Val He Val Val Asn 
305 310 315 320 

teg ata gee aac egg gac ggc acg gtg tac gag gac ccg gac gee etc 1008 
Ser He Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu 
325 330 335 

gac ate cac cgc tec gcg cgc cac cac etc gec ttc ggc ttc ggc gtg 1056 
Asp He His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val 
340 345 350 

cac cag tgc ctg ggc cag aac etc gee egg ctg gag ctg gag gtc ate 1104 
His Gin Cys Leu Gly Gin Asn Leu Ala Arg Leu Glu Leu Glu Val He 
355 360 365 

etc aac gee etc atg gac cgc gtc ccg acg ctg cga ctg gee gtc ccc 1152 
Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro 
370 375 380 
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«• 
egg ccg ggt acg acg ate cag gg^&tc aac 1200 

Val Glu Gin Leu Val Leu Arg Pro Gly Thr Thr lie Gin Gly Val Asn 

385 390 395 400 

gaa etc ccg gtc ace tgg tga 1221 
Glu Leu Pro Val Thr Trp 
405 

<210> 6 
<211> 406 
<212> PRT 

<213> Streptomyces griseolus 
<400> 6 

Met Thr Asp Thr Ala Thr Thr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
1 5 10 15 

Pro Ser Asn Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 

35 40 45 

Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 

50 55 60 

Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 ~ 70 75 80 

Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe lie 

85 90 95 

Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr lie Ser 
100 105 110 

Glu Phe Thr Val Lys Arg lie Lys Gly Met Arg Pro Glu Val Glu Glu 
115 120 125 

Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala 
130 135 140 

Asp Leu Val Ser Gin Phe Ala Leu Pro Val Pro Ser Met Val lie Cys 
145 150 155 160 

Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gin Asp Ala 
165 170 175 

Ser Lys Arg Leu Val Gin Ser Thr Asp Ala Gin Ser Ala Leu Thr Ala 
180 185 190 

Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu lie Thr Gin Phe Gin 

195 200 205 

Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gin Leu 

210 215 220 

Ala Asn Gly Glu lie Asp Arg Glu Glu Leu He Ser Thr Ala Met Leu 
225 230 235 240 

Leu Leu He Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser 
245 250 255 

Val He Thr Leu Leu Asp His Pro Glu Gin Tyr Ala Ala Leu Arg Ala 
260 265 270 

Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu 

275 280 285 

Ala He Ala Asp He Ala Gly Gly Arg Val Ala Thr Ala Asp He Glu 
290 295 300 
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f\ • 
e Arg Ala Gly Glu Gly Val lie VaTVal Asn 

g 305 " 310 315 320 

Ser He Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu 
325 330 335 

Asp He His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val 
340 345 350 

His Gin Cys Leu Gly Gin Asn Leu Ala Arg Leu Glu Leu Glu Val He 
355 360 365 

Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro 
370 375 380 

Val Glu Gin Leu Val Leu Arg Pro Gly Thr Thr lie Gin Gly Val Asn 
385 390 395 400 

Glu Leu Pro Val Thr Trp 
405 



<210> 7 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumef aciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase (tms2) 
<400> 7 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gee ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gec aaa aaa att gat cgt cat gga aac gee gga tta 192 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 

50 55 60 

ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 

65 70 75 80 

ata ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 

100 105 HO 

ccg ggt gec teg gga aac atg cat gag tta teg ttt gga att acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac tat gee acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 ~ 135 140 



624 



672 
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«• 
ggt ggt gtg get get gcg gtg gc^agc cga 480 

"lie Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 " 150 155 160 

ttg atg tta ggc ggc ata ggc acc gat acc ggt gca tct gtt cgc eta 528 
Leu Met Leu Gly Gly lie Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccc gca gec ctg tgt ggc gta gta gga ttt cga ccg acg ctt get cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

tat cca aga gat egg ata ata ccg gtc age ccc acc egg gac acc gee 
Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 " 2 00 205 

gga ate ata gcg cag tgc gta gee gat gtt ata ate etc gac cag gtg 
Gly lie He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 720 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 ~ 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 768 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gee ttc gca get gaa acg acg att cgc ttg eta gee aac aga ggc 816 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gee gac ate ccc cac eta gag gaa ctg aat agt 864 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 960 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 

305 " 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tec 1056 
Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc agg cca agg etc cag gee act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 

355 3 60 3 65 

cag tta gat gca ate ctt ttc cca act gca ccc tta gcg gee aaa gee 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 *" 375 380 

ata ggt cag gag teg tea gtc ate cac aat ggc tea atg atg aac act 1200 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

ttc aag ate tac gtg cga aat gtg gac cca age age aac gca ggc eta 1248 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 
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• • 

cct ggg ttg age ctt^^t gec tgc ctt aca cct gat cgc t€g cct gtt 1296 
- Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gat gga tta gcg ggg tea gac cac cgt ctg tta gca 1344 
Gly Met Glu lie Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

ate ggg gca gca tta gaa aaa gec ata aat ttt cct tec ttt ccc gat 1392 
He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 1404 

Ala Phe Asn 

465 

<210> 8 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 8 

Met Val Pro lie Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
1 5 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 
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13 




Val Ala Phe Ala Ala^Su Thr Thr lie Arg Leu Leu Ala ASrArg Gly 

260 265 270 

Val Thr Phe Val Glu Ala Asp lie Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro lie Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val lie 
305 310 315 320 

Lys Gly lie Arg Ser Pro Asp Val Ala Asn lie Val Ser Ala Gin lie 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 9 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase (tms2) 
<400> 9 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gec ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gee aaa aaa att gat cgt cat gga aac gee gga tta 192 
Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 
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• # 

ggt ctt tgc ggc att^ea etc tgt ttt aag gcg aac ate g^acc ggc 240 
v Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 2 88 
He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

ccg ggt gec teg gga aac atg cat gag tta teg ttt gga att acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac tat gec acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ata cca gga ggc tea age ggt ggt gtg get get gcg gtg gca age cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata ggc acc gat acc ggt gca tct gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccc gca gec ctg tgt ggc gta gta gga ttt cga ccg acg ctt get cga 576 
Pro Ala Ala Leu Gys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

tat cca aga gat egg ata ata ccg gtc age ccc acc egg gac acc gee 624 
Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga ate ata gcg cag tgc gta gee gat gtt ata ate etc gat cag gtg 672 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 720 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 7 68 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gec ttc gca get gaa acg acg att cgc ttg eta gec aac aga ggc 816 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gec gac ate ccc cac eta gag gaa ctg aat agt 864 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 960 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 
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gat ggg cat caa att^cc aac gat gaa tat gaa ctg gcg cgr caa tec 1056 
* Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc agg cca agg etc cag gec act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

cag tta gat gca ate ctt ttc cca act gca ccc tta gcg gee aaa gee 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

ata ggt cag gag teg tea gtc ate cac aat ggc tea atg ata aac act 1200 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met He Asn Thr 
385 390 395 400 

ttc aag ate tac gtg cga aat gtg gac cca age age aac gca ggc eta 1248 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

cct ggg ttg age ctt cct gee tgc ctt aca cct gat cgc ttg cct gtt 129 6 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gac gga tta gcg ggg tea gac cac cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

ate ggg gca gca tta gaa aaa gee ata aat ttt cct tec ttt ccc gat 1392 
He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 1404 

Ala Phe Asn 

465 

<210> 10 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 10 

Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 HO 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 



Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 " 140 
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He Pro Gly Gly Ser 
145 




Gly Gly Val Ala Ala Ala Val AHr Ser Arg 
155 160 



150 



Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met He Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 11 
<211> 609 
<212> DNA 

<213> Xanthobacter autotrophicus 
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<220> 
<221> CDS 
<222> (1)..(603) 

<223> coding for haloalkane dehalohenase 
<400> 11 

atg tea acg ttt ttt gaa ccg gag aac gga atg aaa caa aac gec aaa 48 
Met Ser Thr Phe Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
15 10 15 

acc gaa cga ate ctg gat gtc gcg etc gaa ttg ctt gag aca gag ggt 96 
Thr Glu Arg lie Leu Asp Val Ala Leu Glu Leu Leu Glu Thr Glu Gly 
20 25 30 

gag ttt ggt ttg acg atg agg cag gtg gca acg caa gcg gac atg tec 144 
Glu Phe Gly Leu Thr Met Arg Gin Val Ala Thr Gin Ala Asp Met Ser 
35 40 45 

ctg age aac gtt cag tac tat ttc aag tec gag gac ctg etc etc gtg 192 
Leu Ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 
50 55 60 

gec atg gca gac cgt tac ttt caa egg tgc ctg aca acc atg get gag 240 
Ala Met Ala Asp Arg Tyr Phe Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

cat ccg ccc tta teg gca ggg cgt gat caa cac gee cag tta aga gcg 288 
His Pro Pro Leu Ser Ala Gly Arg Asp Gin His Ala Gin Leu Arg Ala 

85 90 95 

ttg tta cga gaa ctg etc ggt cat ggt ctt gag att tec gag atg tgt 336 
Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu lie Ser Glu Met Cys 
100 105 110 

cga ata ttc agg gag tac tgg gca ate gee acc cgt aat gaa act gtt 384 
Arg lie Phe Arg Glu Tyr Trp Ala lie Ala Thr Arg Asn Glu Thr Val 
115 120 125 

cac ggc tat etc aag teg tac tat egg gat etc gec gaa gtg atg get 432 
His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 
130 135 140 

gag aag ctt gcg cca ctg gee age age gaa aag gcg ctg gee gtg gee 480 
Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
145 150 155 160 

gta tct ttg gtt att cct tat gtt gag ggg tat teg gta acg gee att 528 
Val Ser Leu Val lie Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala lie 
165 170 175 

gca atg ccc gaa tec att gat acg att tec gag acg ctg acc aat gtg 576 
Ala Met Pro Glu Ser lie Asp Thr lie Ser Glu Thr Leu Thr Asn Val 
180 185 190 

gtg ttg gag cag ctt cgc ate age aat tcatga 609 
Val Leu Glu Gin Leu Arg lie Ser Asn 
195 200 

<210> 12 
<211> 201 
<212> PRT 

<213> Xanthobacter autotrophicus 
<400> 12 

Met Ser Thr Phe Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
15 10 15 
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Thr Glu Arg lie Leu lSp Val Ala Leu Glu Leu Leu Glu TfT^Glu Gly 

20 25 30 

Glu Phe Gly Leu Thr Met Arg Gin Val Ala Thr Gin Ala Asp Met Ser 
35 40 45 

Leu Ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 
50 55 60 

Ala Met Ala Asp Arg Tyr Phe Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

His Pro Pro Leu Ser Ala Gly Arg Asp Gin His Ala Gin Leu Arg Ala 

85 90 95 

Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu lie Ser Glu Met Cys 
100 105 110 

Arg lie Phe Arg Glu Tyr Trp Ala lie Ala Thr Arg Asn Glu Thr Val 
115 120 125 

His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 
130 135 140 

Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
145 150 155 160 

Val Ser Leu Val He Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala He 
165 170 175 

Ala Met Pro Glu Ser He Asp Thr He Ser Glu Thr Leu Thr Asn Val 
180 185 190 

Val Leu Glu Gin Leu Arg He Ser Asn 
195 200 



<210> 13 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 

<221> CDS 

<222> (1) . . (1128) 

<223> coding for thymidine kinase (TK) 
<400> 13 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 48 
Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac cga cgt acg gcg ttg cgc cct cgc 96 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gec acg gaa gtc cgc ctg gag cag aaa atg ccc acg 144 
Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

eta ctg egg gtt tat ata gac ggt cct cac ggg atg ggg aaa acc ace 192 
Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

acc acg caa ctg ctg gtg gec ctg ggt teg cgc gac gat ate gtc tac 240 
Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 
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* # 

gta ccc gag ccg atg^rct tac tgg cag gtg ctg ggg get t^^ gag aca 288 
Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 336 
lie Ala Asn lie Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu lie 
100 105 110 

teg gec ggg gac gcg gcg gtg gta atg aca age gee cag ata aca atg 384 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin lie Thr Met 
115 120 125 

ggc atg cct tat gee gtg acc gac gee gtt ctg get cct cat gtc ggg 432 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

ggg gag get ggg agt tea cat gec ccg ccc ccg gee etc acc etc ate 480 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

ttc gac cgc cat ccc ate gec gee etc ctg tgc tac ccg gec gcg cga 528 
Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg ggc age atg acc ccc cag gee gtg ctg gcg ttc gtg gee 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg acc ttg ccc ggc aca aac ate gtg ttg ggg gec ctt 624 
Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

ccg gag gac aga cac ate gac cgc ctg gec aaa cgc cag cgc ccc ggc 672 
Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

gag egg ctt gac ctg get atg ctg gee gcg att cgc cgc gtt tac ggg 720 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

ctg ctt gee aat acg gtg egg tat ctg cag ggc ggc ggg teg tgg tgg 7 68 
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

gag gat tgg gga cag ctt teg ggg acg gee gtg ccg ccc cag ggt gec 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg ggc cca cga ccc cat ate ggg gac acg tta 864 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

ttt acc ctg ttt egg gec ccc gag ttg ctg gec ccc aac ggc gac ctg 912 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

tat aac gtg ttt gee tgg gee ttg gac gtc ttg gee aaa cgc etc cgt 9 60 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gee ggc tgc 1008 
Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gec ctg ctg caa ctt acc tec ggg atg gtc cag acc cac gtc 1056 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 
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acc acc cca ggc tcc^Ra ccg acg ate tgc gac ctg gcg acg ttt 1104 
" Thr Thr Pro Gly Ser He Pro Thr lie Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

gec egg gag atg ggg gag get aac tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 14 
<211> 376 
<212> PRT 

<213> Herpes simplex virus 1 
<400> 14 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Ve.l Leu Gly Ala Ser Glu Thr 

85 90 95 

He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 
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Tyr Asn Val Phe Ala^Wp Ala Leu Asp Val Leu Ala Lys A^Leu Arg 

305 310 315 320 

Pro Met His Val Phe lie Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Tlir Ser Gly Met Val Gin Thr His Val 
340 345 350 

Thr Thr Pro Gly Ser lie Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 



ggg gag get ggg agt tea cat gec ccg ccc ccg gec etc acc etc ate 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 



48 



<210> 15 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 
<221> CDS 
<222> (1) . . (1128) 

<223> coding for thymidine kinase (TK) 
<400> 15 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 
Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac cga cgt acg gcg ttg cgc cct cgc 96 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gec acg gaa gtc cgc ctg gag cag aaa atg ccc acg 144 
Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

eta ctg egg gtt tat ata gac ggt cct cac ggg atg ggg aaa acc acc 192 
Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

acc acg caa ctg ctg gtg gee ctg ggt teg cgc gac gat ate gtc tac 240 
Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 

gta ccc gag ccg atg act tac tgg cag gtg ctg ggg get tec gag aca 2 88 
Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 33 6 
He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

teg gec ggg gac gcg gcg gtg gta atg aca age gec cag ata aca atg 3 84 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

ggc atg cct tat gee gtg acc gac gee gtt ctg get cct cat gtc ggg 432 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 



480 
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ttc gac cgc cat cc^BPEc gcc gcc etc ctg tgc tac ccg g&C gcg cga 528 

Phe Asp Arg His Pro lie Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg ggc age atg acc ccc cag gcc gtg ctg gcg ttc gtg gcc 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg acc ttg ccc ggc aca aac ate gtg ttg ggg gcc ctt 624 
Leu lie Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

ccg gag gac aga cac ate gac cgc ctg gcc aaa cgc cag cgc ccc ggc 672 
Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

gag egg ctt gac ctg get atg ctg gcc gcg att cgc cgc gtt tac ggg 720 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala lie Arg Arg Val Tyr Gly 
225 230 235 240 

ctg ctt gcc aat acg gtg egg tat ctg cag ggc ggc ggg teg tgg tgg 7 68 
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

gag gat tgg gga cag ctt teg ggg acg gcc gtg ccg ccc cag ggt gcc 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg ggc cca cga ccc cat ate ggg gac acg tta 864 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

ttt acc ctg ttt egg gcc ccc gag ttg ctg gcc ccc aac ggc gac ctg 912 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

tat aac gtg ttt gcc tgg gcc ttg gac gtc ttg gcc aaa cgc etc cgt 960 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gcc ggc tgc 1008 
Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gcc ctg ctg caa ctt acc tec ggg atg gtc cag acc cac gtc 1056 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

acc acc cca ggc tec ata ccg acg ate tgc gac ctg gcg cgc acg ttt 1104 
Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

gcc egg gag atg ggg gag get aac tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 16 
<211> 376 
<212> PRT 

<213> Herpes simplex virus 1 
<400> 16 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 



Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 
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Arg Gin Gin Glu Ala 
35 



r Glu Val Arg Leu Glu Gin Lys 
40 45 



Pro Thr 



Leu Leu Arg Val Tyr lie Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp lie Val Tyr 
65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

lie Ala Asn lie Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu lie 
100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin lie Thr Met 
115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 



<210> 17 
<211> 840 
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<212> DNA 
<213> Toxoplasma gondii 

<220> 

<221> CDS 

<222> (1) . . (837) 

<223> coding for hypoxanthine-xanthine-guanine 
phosphor ibosyl trans f eras e ( HXGPRTas e ) 

<400> 17 

atg gcg tec aaa ccc att gaa gaa tec egg teg caa aaa egg agt gee 48 
Met Ala Ser Lys Pro lie Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 

15 10 15 

ttc tea gac ate ttc tgt tgt tgc act cct aat gaa ggg get ate gtg 96 
Phe Ser Asp He Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 

20 25 30 

ccc agt gac cca atg gtc tec ace agt get cca gca cgc ace agt get 144 
Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 

35 40 45 

cca gcg cgc tec agt gca ctt caa gac tac ggc aag ggc aag ggc cgt 192 
Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 

50 55 60 

att gag ccc atg tat ate ccc gac aac acc ttc tac aac get gat gac 240 
He Glu Pro Met Tyr lie Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 70 75 80 

ttt ctt gtg ccc ccc cac tgc aag ccc tac att gac aaa ate etc etc 288 
Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys lie Leu Leu 

85 90 95 

cct ggt gga ttg gtc aag gac aga gtt gag aag ttg gcg tat gac ate 336 
Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 
100 105 110 

cac aga act tac ttc ggc gag gag ttg cac ate att tgc ate ctg aaa 384 

His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 

115 120 125 

ggc tct cgc ggc ttc ttc aac ctt ctg ate gac tac ctt gec acc ata 432 

Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 

130 135 140 

cag aag tac agt ggt cgt gag tec age gtg ccc ccc ttc ttc gag cac 480 

Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 150 155 160 

tat gtc cgc ctg aag tec tac cag aac gac aac age aca ggc cag etc 528 
Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 
165 170 175 

acc gtc ttg age gac gac ttg tea ate ttt cgc gac aag cac gtt ctg 57 6 
Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 

180 185 190 

att gtt gag gac ate gtc gac acc ggt ttc acc etc acc gag ttc ggt 624 
He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 

195 200 205 

gag cgc ctg aaa gec gtc ggt ccc aag teg atg aga ate gec acc etc 672 
Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 

210 215 220 

gtc gag aag cgc aca gat cgc tec aac age ttg aag ggc gac ttc gtc 720 
Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 230 235 240 
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ggc ttc age att ga^^c gtc tgg ate gtt ggt tgc tgc ^^gac ttc 768 

Gly Phe Ser lie Glu Asp Val Trp He Val Gly Cys Cys Tyr Asp Phe 

245 250 255 

aac gag atg ttc cgc gac ttc gac cac gtc gec gtc ctg age gac gee 816 

Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 



get cgc aaa aag ttc gag aag taa 
Ala Arg Lys Lys Phe Glu Lys 
275 

<210> 18 
<211> 279 
<212> PRT 

<213> Toxoplasma gondii 
<400> 18 

Met Ala Ser Lys Pro He Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 
15 10 15 

Phe Ser Asp lie Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 
20 25 30 

Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 
35 40 45 

Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 
50 55 60 

He Glu Pro Met Tyr He Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 " 70 75 80 

Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys He Leu Leu 

85 90 95 

Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 
100 105 110 

His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 
115 120 125 

Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 
130 135 140 

Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 150 155 160 

Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 
165 170 175 

Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 
180 185 190 

He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 
195 200 205 

Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 
210 215 220 

Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 "* 230 235 240 

Gly Phe Ser He Glu Asp Val Trp He Val Gly Cys Cys Tyr Asp Phe 
245 250 255 

Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 



840 
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48 



96 



Ala Arg Lys Lys Phe^Iu Lys 

275 

<210> 19 
<211> 459 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1) . . (456) 

<223> coding for xanthine-guanine phosphor ibosyl 
transferase (gpt) 

<400> 19 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gca 
Met Ser Glu Lys Tyr lie Val Thr Trp Asp Met Leu Gin lie His Ala 
15 10 15 

cgt aaa etc gca age cga ctg atg cct tct gaa caa tgg aaa ggc att 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 

att gec gta age cgt ggc ggt ctg gta ccg ggt gcg tta ctg gcg cgt 144 
He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 

35 40 45 

gaa ctg ggt att cgt cat gtc gat acc gtt tgt att tec age tac gat 192 
Glu Leu Gly lie Arg His Val Asp Thr Val Cys lie Ser Ser Tyr Asp 

50 55 60 

cac gac aac cag cgc gag ctt aaa gtg ctg aaa cgc gca gaa ggc gat 240 
His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 * 70 75 80 

ggc gaa ggc ttc ate gtt att gat gac ctg gtg gat acc ggt ggt act 2 88 
Gly Glu Gly Phe lie Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

gcg gtt gcg att cgt gaa atg tat cca aaa gcg cac ttt gtc acc ate 336 
Ala Val Ala lie Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

ttc gca aaa ccg get ggt cgt ccg ctg gtt gat gac tat gtt gtt gat 3 84 
Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 

ate ccg caa gat acc tgg att gaa cag ccg tgg gat atg ggc gtc gta 432 
He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

ttc gtc ccg cca ate tec ggt cgc taa 459 
Phe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 20 
<211> 152 
<212> PRT 

<213> Escherichia coli 
<400> 20 

Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 
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lie Ala Val Ser Ar^wly Gly Leu Val Pro Gly Ala Leu clu Ala Arg 
35 40 45 

Glu Leu Gly lie Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

Gly Glu Gly Phe He Val lie Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 

He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

Phe Val Pro Pro He Ser Gly Arg 
145 150 



<210> 21 
<211> 459 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (456) 

<223> coding for xanthine-guanine phosphor ibosyl 
trans f erase ( gpt ) 

<400> 21 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gca 48 

Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

cgt aaa etc gca age cga ctg atg cct tct gaa caa tgg aaa ggc att 96 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 

att gee gta age cgt gge ggt ctg gta ccg ggt gcg tta ctg gcg cgt 144 
He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 
35 40 45 

gaa ctg ggt att cgt cat gtc gat acc gtt tgt att tec age tac gat 192 
Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

cac gac aac cag cgc gag ctt aaa gtg ctg aaa cgc gca gaa ggc gat 240 
His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

ggc gaa ggc ttc ate gtt att gat gac ctg gtg gat acc ggt ggt act 2 88 
Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

gcg gtt gcg att cgt gaa atg tat cca aaa gcg cac ttt gtc acc ate 33 6 
Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

ttc gca aaa ccg get ggt cgt ccg ctg gtt gat gac tat gtt gtt gat 3 84 
Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 
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ate ccg caa gat acc^fg att gaa cag ccg tgg gat atg gg^gtc gta 432 
" He Pro Gin Asp Thr Trp lie Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

ttc gtc ccg cca ate tec ggt cgc taa 459 
Phe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 22 
<211> 152 
<212> PRT 

<213> Escherichia coli 
<400> 22 

Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 

He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 
35 40 45 

Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 

He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

Phe Val Pro Pro He Ser Gly Arg 
145 150 



<210> 23 
<211> 720 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (717) 

<223> coding for purine nucleoside phosphorylase (deoD) 
<400> 23 

atg get acc cca cac att aat gca gaa atg ggc gat ttc get gac gta 
Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 
15 10 15 

gtt ttg atg cca ggc gac ccg ctg cgt gcg aag tat att get gaa act 
Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

ttc ctt gaa gat gec cgt gaa gtg aac aac gtt cgc ggt atg ctg ggc 
Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 " 40 45 
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ttc acc ggt act tac^Ka ggc cgc aaa att tec gta atg gWc cac ggt 192 
Phe Thr Gly Thr Tyr Lys Gly Arg Lys lie Ser Val Met Gly His Gly 
50 55 60 

atg ggt ate ccg tec tgc tec ate tac acc aaa gaa ctg ate acc gat 240 
Met Gly lie Pro Ser Cys Ser lie Tyr Thr Lys Glu Leu He Thr Asp 
65 70 75 80 

ttc ggc gtg aag aaa att ate cgc gtg ggt tec tgt ggc gca gtt ctg 288 
Phe Gly Val Lys Lys He lie Arg Val Gly Ser Cys Gly Ala Val Leu 

85 90 95 

ccg cac gta aaa ctg cgc gac gtc gtt ate ggt atg ggt gec tgc acc 3 36 
Pro His Val Lys Leu Arg Asp Val Val He Gly Met Gly Ala Cys Thr 
100 105 110 

gat tec aaa gtt aac cgc ate cgt ttt aaa gac cat gac ttt gee get 384 
Asp Ser Lys Val Asn Arg lie Arg Phe Lys Asp His Asp Phe Ala Ala 
115 120 125 

ate get gac ttc gac atg gtg cgt aac gca gta gat gca get aaa gca 432 
lie Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 
130 135 140 

ctg ggt att gat get cgc gtg ggt aac ctg ttc tec get gac ctg ttc 480 
Leu Gly He Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 150 155 160 

tac tct ccg gac ggc gaa atg ttc gac gtg atg gaa aaa tac ggc att 528 
Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly He 
165 170 175 

etc ggc gtg gaa atg gaa gcg get ggt ate tac ggc gtc get gca gaa 57 6 
Leu Gly Val Glu Met Glu Ala Ala Gly He Tyr Gly Val Ala Ala Glu 
180 185 190 

ttt ggc gcg aaa gec ctg acc ate tgc acc gta tct gac cac ate cgc 624 
Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 
195 200 205 

act cac gag cag acc act gee get gag cgt cag act acc ttc aac gac 672 
Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 
210 215 220 

atg ate aaa ate gca ctg gaa tec gtt ctg ctg ggc gat aaa gag taa 720 
Met He Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 230 235 

<210> 24 
<211> 239 
<212> PUT 

<213> Escherichia coli 
<400> 24 

Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 
15 10 15 

Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 40 45 

Phe Thr Gly Thr Tyr Lys Gly Arg Lys He Ser Val Met Gly His Gly 
50 55 60 

Met Gly He Pro Ser Cys Ser He Tyr Thr Lys Glu Leu He Thr Asp 
65 70 75 80 
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Phe Gly Val Lys Lys~e lie Arg Val Gly Ser Cys Gly OTVal Leu 

85 90 95 

Pro His Val Lys Leu Arg Asp Val Val lie Gly Met Gly Ala Cys Thr 
100 105 110 

Asp Ser Lys Val Asn Arg lie Arg Phe Lys Asp His Asp Phe Ala Ala 
115 120 125 

lie Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 
130 135 140 

Leu Gly lie Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 150 155 160 

Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly lie 
165 170 175 

Leu Gly Val Glu Met Glu Ala Ala Gly lie Tyr Gly Val Ala Ala Glu 
180 185 190 

Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 
195 200 205 

Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 
210 215 220 

Met lie Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 230 235 



<210> 25 
<211> 1545 
<212> DNA 

<213> Burkholderia caryophylli 

<220> 

<221> CDS 

<222> (1)..(1542) 

<223> coding for phosphonate monoester hydrolase (pehA) 
<400> 25 

atg acc aga aaa aat gtc ctg ctt ate gtc gtt gat caa tgg cga gca 48 
Met Thr Arg Lys Asn Val Leu Leu lie Val Val Asp Gin Trp Arg Ala 
1 5 10 15 

gat ttt ate cct cac ctg atg egg gcg gag ggg cgc gaa cct ttc ctt 9 6 
Asp Phe He Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 
20 25 30 

aaa act ccc aat ctt gat cgt ctt tgc egg gaa ggc ttg acc ttc cgc 144 
Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 
35 40 45 

aat cat gtc acg acg tgc gtg ccg tgt ggt ccg gca agg gca age ctg 192 
Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 

50 55 60 

ctg acg ggc etc tac ctg atg aac cac egg gcg gtg cag aac act gtt 240 
Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 70 75 80 

ccg ctt gac cag cgc cat eta aac ctt ggc aag gee ctg cgc gee att 2 88 
Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala He 

85 90 95 

ggc tac gat ccc gcg etc att ggt tac acc acc acg aca cct gat ccg 33 6 
Gly Tyr Asp Pro Ala Leu He Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 HO 
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g gat ccg cgt ttc acg gtc ctg g^c gac ate 384 
Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp lie 
115 120 125 

atg gac ggc ttt cgt teg gtc ggc gca ttc gag ccc aat atg gag ggg 432 
Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 
130 ~ 135 140 

tat ttt ggc tgg gtg gcg cag aac ggc ttc gaa ctg cca gag aac cgc 480 
Tyr Phe Gly Trp Val Ala Gin Asn Gly Phe Glu Leu Pro Glu Asn Arg 
145 150 155 160 

gaa gat ate tgg ctg ccg gaa ggt gaa cat tec gtt ccc ggt get acc 528 
Glu Asp lie Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

gac aaa ccg teg cgc att ccg aag gaa ttt teg gat teg aca ttc ttc 576 
Asp Lys Pro Ser Arg lie Pro Lys Glu Phe Ser Asp Ser Thr Phe Phe 
180 185 190 

acg gag cgc gec ctg aca tat ctg aag ggc agg gac ggc aag cct ttc 624 
Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 
195 200 205 

ttc ctg cat ctt ggc tat tat cgc ccg cat ccg cct ttc gta gee tec 672 
Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 
210 215 220 

gcg ccc tac cat gcg atg tac aaa gee gaa gat atg cct gcg cct ata 720 
Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro lie 
225 230 235 240 

cgt gcg gag aat ccg gat gee gaa gcg gca cag cat ccg etc atg aag 7 68 
Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 
245 250 255 

cac tat ate gac cac ate aga cgc ggc teg ttc ttc cat ggc gcg gaa 816 
His Tyr lie Asp His lie Arg Arg Gly Ser Phe Phe His Gly Ala Glu 
260 265 270 

ggc teg gga gca acg ctt gat gaa ggc gaa att cgc cag atg cgc get 864 
Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu lie Arg Gin Met Arg Ala 
275 280 285 

aca tat tgc gga ctg ate acc gag ate gac gat tgt ctg ggg agg gtc 912 
Thr Tyr Cys Gly Leu lie Thr Glu lie Asp Asp Cys Leu Gly Arg Val 
290 295 300 

ttt gee tat etc gat gaa acc ggt cag tgg gac gac acg ctg att ate 960 
Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu He He 
305 310 315 320 

ttc acg age gat cat ggc gaa caa ctg ggc gat cat cac ctg etc ggc 1008 
Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

aag ate ggt tac aat gee gaa age ttc cgt att ccc ttg gtc ata aag 1056 
Lys He Gly Tyr Asn Ala Glu Ser Phe Arg He Pro Leu Val He Lys 
340 345 350 

gat gcg gga cag aac egg cac gee ggc cag ate gaa gaa ggc ttc tec 1104 
Asp Ala Gly Gin Asn Arg His Ala Gly Gin He Glu Glu Gly Phe Ser 
355 360 365 

gaa age ate gac gtc atg ccg acc ate etc gaa tgg ctg ggc ggg gaa 1152 
Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 
370 375 380 
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acg cct cgc gcc tgc^^Rc ggc cgt teg ctg ttg ccg ttt cWj get gag 120 0 
Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 390 395 400 

gga aag ccc tec gac tgg cgc acg gaa eta cat tac gag ttc gat ttt 1248 
Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

cgc gat gtc ttc tac gat cag ccg cag aac teg gtc cag ctt tec cag 129 6 
Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 
420 425 430 

gat gat tgc age etc tgt gtg ate gag gac gaa aac tac aag tac gtg 1344 
Asp Asp Cys Ser Leu Cys Val lie Glu Asp Glu Asn Tyr Lys Tyr Val 
435 440 445 

cat ttt gcc gcc ctg ccg ccg ctg ttc ttc gat ctg aag gca gac ccg 1392 
His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 
450 455 460 

cat gaa ttc age aat ctg get ggc gat cct get tat gcg gcc etc gtt 1440 
His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

cgt gac tat gcc cag aag gca ttg teg tgg cga ctg tct cat gcc gac 1488 
Arg Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

egg aca etc acc cat tac aga tec age cag caa ggg ctg aca acg cgc 153 6 
Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

aac cat tga 1545 
Asn His 

<210> 26 
<211> 514 
<212> PRT 

<213> Burkholderia caryophylli 
<4O0> 26 

Met Thr Arg Lys Asn Val Leu Leu lie Val Val Asp Gin Trp Arg Ala 
15 10 15 

Asp Phe lie Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 
20 25 30 

Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 
35 40 45 

Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 
50 55 60 

Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 70 75 80 

Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala lie 

85 90 95 

Gly Tyr Asp Pro Ala Leu lie Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 110 

Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp lie 
115 120 125 



Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 
130 135 140 
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€> # 
a Gin Asn Gly Phe Glu Leu Pro GlTAsn Arg 

145 " 150 155 160 

Glu Asp lie Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

Asp Lys Pro Ser Arg lie Pro Lys Glu Phe Ser Asp Ser Thr Phe Phe 
180 185 190 

Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 
195 200 205 

Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 
210 215 220 

Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro lie 
225 ~ 230 235 240 

Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 
245 250 255 

His Tyr lie Asp His lie Arg Arg Gly Ser Phe Phe His Gly Ala Glu 
260 265 270 

Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu lie Arg Gin Met Arg Ala 
275 280 285 

Thr Tyr Cys Gly Leu lie Thr Glu lie Asp Asp Cys Leu Gly Arg Val 
290 295 300 

Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu lie lie 
305 310 315 320 

Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

Lys lie Gly Tyr Asn Ala Glu Ser Phe Arg lie Pro Leu Val lie Lys 
340 345 350 

Asp Ala Gly Gin Asn Arg His Ala Gly Gin lie Glu Glu Gly Phe Ser 
355 360 365 

Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 
370 375 380 

Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 390 395 400 

Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 
^ 42 0 42 5 430 

Asp Asp Cys Ser Leu Cys Val He Glu Asp Glu Asn Tyr Lys Tyr Val 
435 440 445 

His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 
450 455 460 

His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

Arg Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

Asn His 
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<210> 27 
<211> 2250 
<212> DNA 

<213> Agrobacterium rhizogenes 

<220> 

<221> CDS 

<222> (1) . . (2247) 

<223> coding for tryptophane oxygenase (auxl) 
<400> 27 

atg get gga tec tec ttc aca ttg cca tea act ggc tea gcg ccc ctt 48 
Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 
1 5 10 15 

gat atg atg ctt ate gat gat tea gat ctg ctg caa ttg ggt etc cag 96 
Asp Met Met Leu He Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 
20 25 30 

cag gta ttc teg aag egg tac aca gag aca ccg cag tea cgc tac aaa 144 
Gin Val Phe Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 
35 40 45 

ctg ace agg agg get tct cca gac gtc tea tct ggc gaa ggc aat gtg 192 
Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 
50 55 60 

cat gee ctt gcg ttc ata tat gtc aac get gag acg ttg cag atg ate 240 
His Ala Leu Ala Phe He Tyr Val Asn Ala Glu Thr Leu Gin Met lie 
65 70 75 80 

aaa aac get cga teg eta acc gaa gcg aac ggc gtc aaa gat ctt gtc 2 88 
Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 

85 90 95 

gee ate gac gtt ccg cca ttt cga aac gac ttc tea aga gcg eta etc 336 
Ala He Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 
100 105 110 

ctt caa gtg ate aac ttg ttg gga aac aac cga aat gee gat gac gat 3 84 
Leu Gin Val lie Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 
115 120 125 

ctt agt cac ttc ata gca gtt get etc cca aac age gee cgc tct aag 432 
Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 
130 135 140 

ate eta acc acg gca ccg ttc gaa gga age ttg tea gaa aac ttc agg 480 
He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

ggg ttc ccg ate act cgt gaa gga aat gtg gca tgt gaa gtg eta gec 528 
Gly Phe Pro He Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 
165 170 175 

tat ggg aat aac ttg atg ccc aag gee tgc tec gat tec ttt cca acc 576 
Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
180 185 190 

gtg gat ctt ctt tat gac tat ggc aag ttc ttc gag agt tgc gcg gec 624 
Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 
195 200 205 

gat gga cgt ate ggt tat ttt cct gaa ggc gtt acg aaa cct aaa gtg 672 
Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 
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get ata att ggc gec^gc ttt tec ggg etc gtt gca gcg a!Jc gaa eta 720 
Ala lie lie Gly Ala Gly Phe Ser Gly Leu Val Ala Ala Ser Glu Leu 
225 230 235 240 

ctt cat gca ggg gta gac gat gtt acg gtg tat gag gcg agt gat egg 768 
Leu His Ala Gly Val Asp Asp Val Thr Val Tyr Glu Ala Ser Asp Arg 
245 250 255 

ctt gga gga aag eta tgg tea cac gga ttt aag agt get cca aat gtg 816 
Leu Gly Gly Lys Leu Trp Ser His Gly Phe Lys Ser Ala Pro Asn Val 
260 265 270 

ata gee gag atg ggg gee atg cgt ttt ccg cga agt gaa tea tgc ttg 864 
He Ala Glu Met Gly Ala Met Arg Phe Pro Arg Ser Glu Ser Cys Leu 
275 280 285 

ttc ttc tat etc aaa aag cac gga ctg gac tec gtt ggt ctg ttc ceg 912 
Phe Phe Tyr Leu Lys Lys His Gly Leu Asp Ser Val Gly Leu Phe Pro 
290 295 300 

aat ccg gga agt gtc gat acc gca ttg ttc tac agg ggc cgt caa tat 9 60 
Asn Pro Gly Ser Val Asp Thr Ala Leu Phe Tyr Arg Gly Arg Gin Tyr 
305 310 315 320 

ate tgg aaa gcg gga gag gag cca ccg gag ctg ttt cgt cgt gtg cac 1008 
He Trp Lys Ala Gly Glu Glu Pro Pro Glu Leu Phe Arg Arg Val His 
325 330 335 

cat gga tgg cgc gca ttt ttg caa gat ggc tat etc cat gat gga gtc 1056 
His Gly Trp Arg Ala Phe Leu Gin Asp Gly Tyr Leu His Asp Gly Val 
340 345 350 

atg ttg gcg tea ccg tta gca att gtt gac gee ttg aat tta ggg cat 1104 
Met Leu Ala Ser Pro Leu Ala lie Val Asp Ala Leu Asn Leu Gly His 
355 360 365 

eta cag cag gcg cat ggc ttc tgg caa tct tgg etc aca tat ttt gag 1152 
Leu Gin Gin Ala His Gly Phe Trp Gin Ser Trp Leu Thr Tyr Phe Glu 
370 375 380 

cga gag tct ttc tct tct ggc ate gaa aaa atg ttc ttg ggc aat cat 1200 
Arg Glu Ser Phe Ser Ser Gly He Glu Lys Met Phe Leu Gly Asn His 
385 390 395 400 

cct ccg ggg ggt gaa caa tgg aat tec eta gat gac ttg gat ctt ttc 1248 
Pro Pro Gly Gly Glu Gin Trp Asn Ser Leu Asp Asp Leu Asp Leu Phe 
405 410 415 

aaa gcg ctg ggt att gga tec ggc gga ttc ggc cct gta ttt gaa agt 1296 
Lys Ala Leu Gly lie Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser 
420 425 430 

ggg ttt ate gag ate ctt cgc tta gtc gtc aac ggg tat gag gat aac 1344 
Gly Phe He Glu He Leu Arg Leu Val Val Asn Gly Tyr Glu Asp Asn 
435 440 445 

gtg egg ctg agt tac gaa gga att tct gag ctg cct cat agg ate gee 1392 
Val Arg Leu Ser Tyr Glu Gly He Ser Glu Leu Pro His Arg He Ala 
450 455 460 

tea cag gta att aac ggc aga tct att cgc gag cgt aca att cac gtt 1440 
Ser Gin Val He Asn Gly Arg Ser He Arg Glu Arg Thr He His Val 
465 470 475 480 



caa gtc gag cag att gat aga gag gag gat aaa ata aat ate aag ate 
Gin Val Glu Gin He Asp Arg Glu Glu Asp Lys He Asn He Lys He 



1488 



485 490 495 
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aaa gga gga aag gtl^Jag gtc tat gat cga gta ctg gtt roa tec ggg 153 6 
Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

ttt gcg aac ate gaa atg cgc cat etc ctg aca tea age aac gca ttc 1584 
Phe Ala Asn lie Glu Met Arg His Leu Leu Thr Ser Ser Asn Ala Phe 
515 520 525 

ttc cat gca gat gta age cat gca at a ggg aac agt cat atg act ggt 1632 
Phe His Ala Asp Val Ser His Ala He Gly Asn Ser His Met Thr Gly 
530 535 540 

gcg tea aaa ctg ttc ttg ctg act aac gaa aaa ttc tgg eta caa cat 1680 
Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

cat ttg cca teg tgc ata etc ace ace ggc gtt gca aag gca gtt tat 1728 
His Leu Pro Ser Cys He Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

tgc tta gac tat gat ccg cga gat cca age ggc aaa gga ctg gtg ttg 1776 
Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

ata age tat act tgg gag gat gac tea cat aag etc eta gee gtc ccc 1824 
He Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

gac aaa aga gaa agg ttc gca teg ctg cag cgc gat att ggg agg gca 1872 
Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp lie Gly Arg Ala 
610 615 620 

ttc cca gat ttt gec aag cac eta act cct gca gac ggg aac tat gat 1920 
Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 
625 630 635 640 

gat aat ate gtt caa cat gat tgg ctg act gat ccc cac get ggc gga 1968 
Asp Asn He Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

gcg ttt aaa ctg aac cgc aga ggc aac gac gta tat tea gaa agg ctt 2016 
Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

ttc ttt cag ccc ttt gac gta atg cat ccc gcg gac gat aag gga ctt 2064 
Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

tac ttg gee ggt tgt age tgt tec ttc ace gga ggg tgg gtt cat ggt 2112 
Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

gee att cag ace gca tgc aac get acg tgt gcg ate att tat ggt tec 2160 
Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

gga cac ctg caa gag eta ate cac tgg cga cac etc aaa gaa ggt aat 2208 
Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 
725 730 735 

cca ctg gcg cac get tgg aag egg tat agg tat caa gcg tga 2250 
Pro Leu Ala His Ala Trp Lys Arg Tyr Arg Tyr Gin Ala 
740 745 



<210> 28 
<211> 749 
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<212> PRT 
<213> Agrobacterium rhizogenes 

<400> 28 

Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 
1 5 10 15 

Asp Met Met Leu lie Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 
20 25 30 

Gin Val Plie Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 
35 40 45 

Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 
50 55 60 

His Ala Leu Ala Phe lie Tyr Val Asn Ala Glu Thr Leu Gin Met lie 
65 70 75 80 

Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 

85 90 95 

Ala He Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 
100 105 110 

Leu Gin Val He Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 
115 120 125 

Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 
130 135 140 

He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

Gly Phe Pro He Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 
165 170 175 

Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
180 185 19 0 

Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 
195 200 205 

Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 

Ala He He Gly Ala Gly Phe Ser Gly Leu Val Ala Ala Ser Glu Leu 
225 230 235 240 

Leu His Ala Gly Val Asp Asp Val Thr Val Tyr Glu Ala Ser Asp Arg 
245 250 255 

Leu Gly Gly Lys Leu Trp Ser His Gly Phe Lys Ser Ala Pro Asn Val 
2 60 265 27 0 

He Ala Glu Met Gly Ala Met Arg Phe Pro Arg Ser Glu Ser Cys Leu 
275 280 285 

Phe Phe Tyr Leu Lys Lys His Gly Leu Asp Ser Val Gly Leu Phe Pro 
290 295 300 

Asn Pro Gly Ser Val Asp Thr Ala Leu Phe Tyr Arg Gly Arg Gin Tyr 
305 310 315 320 

He Trp Lys Ala Gly Glu Glu Pro Pro Glu Leu Phe Arg Arg Val His 
325 330 335 

His Gly Trp Arg Ala Phe Leu Gin Asp Gly Tyr Leu His Asp Gly Val 
340 345 350 
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Met Leu Ala Ser Pr< 
355 




iu Ala lie Val Asp Ala Leu Asn 
360 365 



Gly His 



Leu Gin Gin Ala His Gly Phe Trp Gin Ser Trp Leu Thr Tyr Phe Glu 
370 375 380 

Arg Glu Ser Phe Ser Ser Gly lie Glu Lys Met Phe Leu Gly Asn His 
385 390 395 400 

Pro Pro Gly Gly Glu Gin Trp Asn Ser Leu Asp Asp Leu Asp Leu Phe 
405 410 415 

Lys Ala Leu Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser 
420 425 430 

Gly Phe He Glu lie Leu Arg Leu Val Val Asn Gly Tyr Glu Asp Asn 
435 440 445 

Val Arg Leu Ser Tyr Glu Gly He Ser Glu Leu Pro His Arg He Ala 
450 455 460 

Ser Gin Val He Asn Gly Arg Ser He Arg Glu Arg Thr He His Val 
465 470 475 480 

Gin Val Glu Gin He Asp Arg Glu Glu Asp Lys He Asn He Lys He 
485 490 495 

Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

Phe Ala Asn He Glu Met Arg His Leu Lf^i Thr Ser Ser Asn Ala Phe 
515 520 " 525 

Phe His Ala Asp Val Ser His Ala He Gly Asn Ser His Met Thr Gly 
530 535 540 

Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

His Leu Pro Ser Cys He Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

He Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp He Gly Arg Ala 
610 615 620 

Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 
625 630 635 640 

Asp Asn He Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 



725 



730 



735 
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Pro Leu Ala His Ale? 

740 745 



Lys Arg Tyr Arg Tyr Gin Ala 



<210> 29 

<211> 1401 

<212> DNA 

<213> Agrobacterium rhizogenes 

<220> 

<221> CDS 

<222> (1) . . (1398) 

<223> coding for indole acetamide hydrolase 
<400> 29 

atg gtg acc etc tec teg ate acc gag acg ctt aaa tgt etc agg gaa 48 
Met Val Thr Leu Ser Ser He Thr Glu Thr Leu Lys Cys Leu Arg Glu 
15 10 15 

aga aaa tac teg tgc ttt gag tta ate gaa acg ata ata gee cgc tgt 9 6 
Arg Lys Tyr Ser Cys Phe Glu Leu He Glu Thr He lie Ala Arg Cys 
20 25 30 

gaa gca gca aga tec tta aac gec ttt ctg gaa acc gac tgg gcg cac 144 
Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 
35 40 45 

eta egg tgg act gee age aaa ate gat caa cac gga ggt gee ggt gtt 192 
Leu Arg Trp Thr Ala Ser Lys He Asp Gin His Gly Gly Ala Gly Val 
50 55 60 

ggc eta get ggc gtt ccc eta tgc ttt aaa gcg aat att gcg aca ggc 240 
Gly Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

agg ttc gee gcg acc get ggt acg cca ggc tta cag aac cac aaa ccc 288 
Arg Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

aag acg cct gee gga gtt gca cga caa ctt etc gcg get ggg gca ctg 336 
Lys Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 
100 105 110 

cct ggc get teg gga aac atg cac gaa ttg tct ttt ggg ate acg age 3 84 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac ttc gee aca ggc gee gta cga aac ccg tgg aac cct agt etc 432 
Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ate cca ggg gga tea agt ggg ggt gtg gee gee gcg gtg gee ggc cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 150 155 160 

ttg atg ctg ggc ggc gtc gga act gac acg gga gcg teg gtc cgt tta 528 
Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccg gee gee ttg tgc ggc gtg gtg ggg ttt cgt cct acc gtg ggg cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 
180 185 190 

tat cca acg gac gga ata gtt ccg gta age ccc acc egg gac acc cct 624 
Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 
195 200 205 
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ggc gtt ate gca ca^^fat gtt ccg gac gtg att ctt ctt g3c ggt ate 672 
Gly Val lie Ala Gin Asn Val Pro Asp Val lie Leu Leu Asp Gly lie 
210 215 220 

att tgc ggg aga ccg ccg gtt aat caa acg gtc cgc ctg aag ggg ctg 720 
He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 230 235 240 

cgt ata ggc ttg cca acc get tac ttt tac aac gac ctg gag ccc gat 768 
Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 
245 250 255 

gtc gec tta gca gec gag acg att ate aga gtt ctg gca cgc aaa gat 816 
Val Ala Leu Ala Ala Glu Thr lie lie Arg Val Leu Ala Arg Lys Asp 
260 265 270 

gtt act ttt gtt gaa gca gat att cct gat tta gcg cat cac aat gaa 8 64 
Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 
275 280 285 

ggg gtc age ttt ccg act gec ate tac gaa ttt ccg ttg tec ctt gaa 912 
Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 
290 295 300 

cat tat att cag aac ttc gta gag ggt gtt tec ttt tct gag gtt gtc 9 60 
His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

aga gcg att cgc agt ccg gat gtt gca agt att etc aat gca caa etc 1008 
Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 
325 330 335 

teg gat aat ctt att tec aaa age gag tat tgt ctg gcg cga cgt ttt 
Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 

ttc aga ccg aga etc caa gcg gee tac cac agt tac ttc aag gcg cat 1104 
Phe Arg Pro Arg Leu Gin Ala Ala Tyr His Ser Tyr Phe Lys Ala His 
355 360 365 

cag eta gat gca att ctt ttc cca aca get ccg ttg aca gee aag cca 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

att ggc cat gat eta teg gtg att cac aat ggc tea atg acc gat acc 1200 
He Gly His Asp Leu Ser Val He His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg egg aat gta gat ccc age agt aat gcg ggc ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

ccg ggc eta agt ctt ccc gtt tct ctt agt tec aac ggt ctg cct att 129 6 
Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro He 
420 425 430 

ggc atg gaa ate gat ggc tct gca age teg gat gaa cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 
435 440 445 

att gga eta gcg ata gaa gaa gca ata gac ttt agg cat cgt ccg act 1392 
He Gly Leu Ala He Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 455 460 

ctg teg taa 1401 
Leu Ser 
465 



1056 
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<210> 30 
<211> 466 
<212> PRT 

<213> Agrobacterium rhizogenes 
<400> 30 

Met Val Thr Leu Ser Ser lie Thr Glu Thr Leu Lys Cys Leu Arg Glu 
15 10 15 

Arg Lys Tyr Ser Cys Phe Glu Leu lie Glu Thr lie lie Ala Arg Cys 
20 . 25 30 

Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 
35 40 45 

Leu Arg Trp Thr Ala Ser Lys lie Asp Gin His Gly Gly Ala Gly Val 
50 55 60 

Gly Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn lie Ala Thr Gly 
65 70 75 80 

Arg Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

Lys Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 150 155 160 

Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 
180 185 190 

Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 
195 200 205 

Gly Val He Ala Gin Asn Val Pro Asp Val He Leu Leu Asp Gly He 
210 215 220 

He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 
245 250 255 

Val Ala Leu Ala Ala Glu Thr He He Arg Val Leu Ala Arg Lys Asp 
260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 
275 280 285 

Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 
290 295 300 

His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 
325 330 335 

Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 
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Phe Arg Pro Arg Leu^ffn Ala Ala Tyr His Ser Tyr Phe Lys Ala His 
355 360 365 

Gin Leu Asp Ala lie Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

lie Gly His Asp Leu Ser Val lie His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

Phe Lys He Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro He 
42 0 425 430 

Gly Met Glu He Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 
435 440 445 

He Gly Leu Ala He Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 455 460 

Leu Ser 
465 



<210> 31 
<211> 2268 
<212> DNA 

<213> Agrobacterium tumef aciens 

<220> 

<221> CDS 

<222> (1) • . (2265) 

<223> coding for tryptophan monooxygenase 
<400> 31 

atg tea get tea cct etc ctt gat aac cag tgc gat cat ttc tct ace 48 
Met Ser Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 
15 10 15 

aaa atg gtg gat ctg ata atg gtc gat aag get gat gaa ttg gac cgc 96 
Lys Met Val Asp Leu He Met Val Asp Lys Ala Asp Glu Leu Asp Arg 
20 25 30 

agg gtt tec gat gee ttc tea gaa cgt gaa get tct agg gga agg agg 144 
Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 
35 40 45 

att act caa ate tec ggc gag tgc age get ggg tta get tgc aaa agg 192 
He Thr Gin He Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 
50 55 60 

ctg gee gac ggt cgc ttt ccc gag ate tea act ggt gag aag gta gca 240 
Leu Ala Asp Gly Arg Phe Pro Glu He Ser Thr Gly Glu Lys Val Ala 
65 "* 70 75 80 

gec etc tec get tac ate tat gtt ggc aag gaa att ctg ggg egg ata 2 88 
Ala Leu Ser Ala Tyr He Tyr Val Gly Lys Glu He Leu Gly Arg He 

85 90 95 

ctt gaa teg gaa cct tgg gcg cga gca aga gtg agt ggt etc gtt gee 33 6 
Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 
100 105 110 

ate gac ctt gca cca ttt tgt atg gat ttc tec gaa gca caa ctt etc 384 
He Asp Leu Ala Pro Phe Cys Met Asp phe Ser Glu Ala Gin Leu Leu 
115 120 125 
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caa acc ctg ttt ttg^tg age ggt aaa aga tgt gca tec agC^ gat ctt 432 
Gin Thr Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 
130 135 140 

agt cat ttc gtg gec att tea ate tct aag act gec cgc tec cga acc 480 
Ser His Phe Val Ala lie Ser lie Ser Lys Thr Ala Arg Ser Arg Thr 
145 150 155 160 

ctg caa atg ccg ccg tac gag aaa ggc acg acg aaa cgc gtt acc ggg 52 8 
Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 
165 170 175 

ttt acc ctg acc ctt gaa gag gec gta cca ttt gac atg gta get tat 576 
Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 

ggt cga aac ctg atg ctg aag get teg gca ggt tec ttt cca aca att 624 
Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr He 
195 200 205 

gac ttg etc tat gac tac aga teg ttt ttt gac caa tgt tec gat att 672 
Asp Leu Leu Tyr Asp Tyr Arg Ser Phe Phe Asp Gin Cys Ser Asp He 
210 215 220 

gga egg ate ggc ttc ttt ccg gaa gat gtt cct aag ccg aaa gtg gcg 720 
Gly Arg He Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 230 235 240 

ate att ggc get ggc att tec gga etc gtg gta gca age gaa ctg ctt 768 
He He Gly Ala Gly He Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

cat get ggt gta gac gat gtt aca ata tat gaa gca agt gat egg gtt 816 
His Ala Gly Val Asp Asp Val Thr He Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

gga ggc aag ctt tgg tea cat get ttc aag gat get ccc age gtg gtg 864 
Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 
275 2 80 2 85 

gee gaa atg ggg gcg atg cga ttt cct cct get gca teg tgc ttg ttt 912 
Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 
290 295 300 

ttc ttc etc gag egg tac ggc ctg tct teg atg agg ccg ttc cca aat 960 
Phe Phe Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 
305 310 315 320 

ccc ggc aca gtc gac act aac ttg gtc tac caa ggc etc cga tac gtg 1008 
Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

tgg aaa gee ggg cag cag cca ccg aag ctg ttc cat cgc gtt tac age 1056 
Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 
340 345 350 

ggt tgg cgt gcg ttc ttg agg gac ggt ttc cat gag gga gat att gtg 1104 
Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp He Val 
355 360 365 

ttg get teg cct gtt gtt att act caa gee ttg aaa tea gga gac att 1152 
Leu Ala Ser Pro Val Val He Thr Gin Ala Leu Lys Ser Gly Asp He 
370 375 380 

agg egg get cat gac tec tgg caa act tgg ctg aac cgt ttc ggg agg 1200 
Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 
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gag tec ttc tct tca^^g ata gag agg ate ttt ctg ggc a^^ cat cct 1248 
Glu Ser Phe Ser Ser Ala He Glu Arg He Phe Leu Gly Thr His Pro 
405 410 415 

cct ggt ggt gaa aca tgg agt ttc cct cat gat tgg gac eta ttc aag 1296 
Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

eta atg gga ata gga tct ggc ggg ttt ggt cca gtt ttt gaa age ggg 1344 
Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

ttt att gag ate ctt cgc ttg gtc ata aac gga tat gaa gaa aat cag 1392 
Phe lie Glu He Leu Arg Leu Val He Asn Gly Tyr Glu Glu Asn Gin 

450 455 460 

egg atg tgc tct gaa gga ate tea gaa ctt cca cgt cga ata gee tct 1440 
Arg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 470 475 480 

caa gtg gtt aac ggt gtg tct gta age cag cgt ata cgc cat gtt caa 1488 
Gin Val Val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

gtc agg gcg att gag aag gaa aag aca aaa ata aag ata agg ctt aag 153 6 
Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

age ggg ata tct gaa ctt tat gat aag gtg gtg gtt aca tct gga etc 1584 
Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 
515 520 525 

gca aat ate caa etc agg cat tgt ctg aca tgc gat ace ace att ttt 1632 
Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 

530 535 540 

cgt gca cca gtg aac caa gcg gtt gat aac age cat atg aca ggc teg 1680 
Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

tea aaa etc ttt ctg ctg act gaa cga aaa ttt tgg tta gac cat ate 1728 
Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

etc ccg tec tgt gtc etc atg gac ggg ate gca aaa gca gtg tac tgc 1776 
Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 
580 585 590 

ttg gac tat gag ccg cag gat ccg aat ggt aaa ggt ctg gtg ccc ccc 
Leu Asp Tyr Glu Pro Gin Asp Pro Asn Gly Lys Gly Leu Val Pro Pro 
595 600 605 

act tat aca tgg gag gac gac tec cac aag ctg ttg gcg gtt ccc gac 1872 
Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 

610 615 620 

aaa aaa gag cga ttc tgt ctg ctg egg gac gca att teg aga tct ttc 192 0 
Lys Lys Glu Arg Phe Cys Leu Leu Arg Asp Ala He Ser Arg Ser Phe 
625 630 635 640 

ccg gcg ttt gee cag cat eta gtt cct gee tgc get gat tac gac caa 1968 
Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

aat gtt gtt caa cat gat tgg ctt aca gac gag aat gee ggg gga get 2016 
Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 



1824 
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ttc aaa etc aac cg^^gt ggc gag gat ttt tat tct gaa gffa ctt ttc 2064 
Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
675 680 685 

ttt caa gcg ctg gac atg cct aat gat acc gga gtt tac ttg gcg ggt 2112 
Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 
690 695 700 

tgc agt tgt tec ttc acc ggt gga tgg gtg gag ggc get att cag acc 2160 
Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala lie Gin Thr 
705 710 715 720 

gcg tgt aac gec gtc tgt gca att ate cac aat tgt gga ggt att ttg 2208 
Ala Cys Asn Ala Val Cys Ala lie lie His Asn Cys Gly Gly lie Leu 
725 730 735 

gca aag gac aat cct etc gaa cac tct tgg aag aga tat aac tac cgc 2256 
Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 
740 745 750 

aat aga aat taa 2268 
Asn Arg Asn 
755 

<210> 32 
<211> 755 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 32 

Met Ser Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 
15 10 15 

Lys Met Val Asp Leu lie Met Val Asp Lys Ala Asp Glu Leu Asp Arg 
20 25 30 

Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 
35 40 45 

lie Thr Gin lie Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 
50 55 60 

Leu Ala Asp Gly Arg Phe Pro Glu lie Ser Thr Gly Glu Lys Val Ala 
65 70 75 80 

Ala Leu Ser Ala Tyr lie Tyr Val Gly Lys Glu lie Leu Gly Arg lie 

85 90 95 

Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 
100 105 110 

lie Asp Leu Ala Pro Phe Cys Met Asp Phe Ser Glu Ala Gin Leu Leu 
115 120 125 

Gin Thr Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 
130 135 140 

Ser His Phe Val Ala lie Ser lie Ser Lys Thr Ala Arg Ser Arg Thr 
145 150 155 160 

Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 
165 170 175 

Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 



Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr lie 
195 200 205 
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Asp Leu Leu Tyr Asj? 
210 




Arg Ser Phe Phe Asp Gin Cys 
215 220 



Asp lie 



Gly Arg lie Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 230 235 240 

lie lie Gly Ala Gly He Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

His Ala Gly Val Asp Asp Val Thr He Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 
275 280 285 

Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 
290 295 300 

Phe Phe Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 
305 310 315 320 

Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 
340 345 350 

Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp He Val 
355 360 365 

Leu Ala Ser Pro Val Val He Thr Gin Ala Leu Lys Ser Gly Asp He 
370 375 380 

Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 

Glu Ser Phe Ser Ser Ala He Glu Arg He Phe Leu Gly Thr His Pro 
405 410 415 

Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

Phe He Glu He Leu Arg Leu Val He Asn Gly Tyr Glu Glu Asn Gin 
450 455 460 

Arg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 470 475 480 

Gin Val Val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 
515 520 525 

Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 
530 535 540 

Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 



580 



585 



590 
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• # 

Leu Asp Tyr Glu Pro^Kn Asp Pro Asn Gly Lys Gly Leu Pro Pro 

595 600 605 

Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 
610 615 620 

Lys Lys Glu Arg Phe Cys Leu Leu Arg Asp Ala lie Ser Arg Ser Phe 
625 630 635 640 

Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 

Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
675 680 685 

Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 
690 695 700 

Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala lie Gin Thr 
705 ~ 710 715 720 

Ala Cys Asn Ala Val Cys Ala lie lie His Asn Cys Gly Gly lie Leu 
725 730 735 

Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 
740 745 750 

Asn Arg Asn 
755 



<210> 33 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase 
<400> 33 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro lie Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata gcg cgt tgc 9 6 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cca tta aat gec ctt ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg cga age gee aaa aaa aat gat cgt cat gga aac gee gga tta 192 
Leu Arg Arg Ser Ala Lys Lys Asn Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

gta ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
Val Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 
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aag ata cca tec cgc^c gca gaa aga ctt ttt tea get g9« gca ctg 336 
Lys lie Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

ccg ggt gee teg gga aac atg cat gag tta teg ttt gga att acg age 384 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly lie Thr Ser 
115 120 125 

aac aac tat gec ace ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

ata cca ggg ggt tea age ggt ggt gtg get get gcg gtg gca age cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata ggc acg gat acc ggt gca tct gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccg gca gee ctg tgt ggc gta gta gga ttt cga ccg acg ctt ggt cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Gly Arg 
180 185 190 

tat cca aga gat egg ata ata ccg ttc age ccc acc egg gac acc gee 624 
Tyr Pro Arg Asp Arg He He Pro Phe Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga ate ata gcg cag tgc gta gec gat gtt ata ate etc gac cag gtg 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 "* 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 



672 



720 



768 



816 



912 



gtg gec ttc gca get gaa acg acg att cgc ttg eta gec aac aga ggc 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gee gac ate ccc cac eta gag gaa ttg aac agt 864 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 960 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 ~ 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tec 1056 
Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc agg cca agg etc cag gee act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 
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cag tta gat gca atc^Tt ttc cca 
Gin Leu Asp Ala lie Leu Phe Pro 
370 375 

ata ggt cag gag teg tea gtc ate 
lie Gly Gin Glu Ser Ser Val He 
385 390 

ttc aag ate tac gtg cga aat gtg 
Phe Lys He Tyr Val Arg Asn Val 
405 

cct ggg ttg age ctt cct gee tgc 
Pro Gly Leu Ser Leu Pro Ala Cys 
420 

gga atg gaa att gat gga tta gcg 
Gly Met Glu He Asp Gly Leu Ala 
435 440 

ate ggg gca gca tta gaa aaa get 
He Gly Ala Ala Leu Glu Lys Ala 
450 455 

get ttt aat tag 
Ala Phe Asn 
465 

<210> 34 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 34 

Met Val Pro He Thr Ser Leu Ala 
1 5 

Lys Asp Tyr Ser Cys Leu Glu Leu 
20 

Gin Ala Ala Lys Pro Leu Asn Ala 
35 40 

Leu Arg Arg Ser Ala Lys Lys Asn 
50 55 

Gly Leu Cys Gly He Pro Leu Cys 
65 70 

Val Phe Pro Thr Ser Ala Ala Thr 

85 

Lys He Pro Ser Arg Val Ala Glu 
100 

Pro Gly Ala Ser Gly Asn Met His 
115 120 

Asn Asn Tyr Ala Thr Gly Ala Val 
130 135 

He Pro Gly Gly Ser Ser Gly Gly 
145 150 

Leu Met Leu Gly Gly He Gly Thr 
165 

Pro Ala Ala Leu Cys Gly Val Val 
180 



PCT7EP2003/007877 



act gca ccc tta gcg g^F'aaa gee 
Thr Ala Pro Leu Ala Ala Lys Ala 
380 

cac aat ggc tea atg atg aac act 
His Asn Gly Ser Met Met Asn Thr 
395 400 

gac cca age age aac gca ggc eta 
Asp Pro Ser Ser Asn Ala Gly Leu 
410 415 

ctt aca cct gat cgc ttg cct gtt 
Leu Thr Pro Asp Arg Leu Pro Val 
425 430 

ggg tea gac cac cgt ctg tta gca 
Gly Ser Asp His Arg Leu Leu Ala 
445 

ata aat ttt tct tec ttt ccc gat 
He Asn Phe Ser Ser Phe Pro Asp 
460 



Gin Thr Leu Glu Arg Leu Arg Arg 
10 15 

Val Glu Thr Leu He Ala Arg Cys 
25 30 

Leu Leu Ala Thr Asp Trp Asp Gly 

45 

Asp Arg His Gly Asn Ala Gly Leu 
60 

Phe Lys Ala Asn He Ala Thr Gly 
75 80 

Pro Ala Leu He Asn His Leu Pro 
90 95 

Arg Leu Phe Ser Ala Gly Ala Leu 
105 HO 

Glu Leu Ser Phe Gly He Thr Ser 
125 

Arg Asn Pro Trp Asn Pro Ser Leu 
140 

Val Ala Ala Ala Val Ala Ser Arg 
155 160 

Asp Thr Gly Ala Ser Val Arg Leu 
170 175 

Gly Phe Arg Pro Thr Leu Gly Arg 
185 190 



1152 



1200 



1248 



1296 



1344 



1392 



1404 
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# 50 • 

Tyr Pro Arg Asp Arg^ffe He Pro Phe Ser Pro Thr Arg ASJTThr Ala 

195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 

225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 

305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 ~ 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Ser Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 35 
<211> 1419 
<212> DNA 

<213> Agrobacterium vitis 

<220> 

<221> CDS 

<222> (1) . . (1416) 

<223> coding for indole acetamide hydrolase 
<400> 35 

atg gtg acc eta ggt tea ate aag gaa ace ctg gaa tgt etc agg ctg 
Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 
15 10 15 
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aaa aaa tac tec tgt^fe= gaa ctg get gaa acc ata ata ^^cgt tgc 9 6 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr lie He Ala Arg Cys 
20 25 30 

gaa gec gcg aaa tct etc aat get ctt ctg gcg act gac tgg gat tac 144 
Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
35 40 45 

ctg egg cgt aat gee aag aaa gta gat gaa gat gga age gee ggc gag 192 
Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 

50 55 60 

ggt ctt gec ggc ate ccg ctg tgt tct aaa gcg aac att gca aca ggc 240 
Gly Leu Ala Gly lie Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttc cca gca age gcg gee acg ccg gcg ctt gat gaa cat tta cct 288 
He Phe Pro Ala Ser Ala Ala Thr Pro Ala Leu Asp Glu His Leu Pro 

85 90 95 

aca aca cca gee ggc gtc cgt aaa ccg ctt eta gac get ggg gca ctg 336 
Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

ata ggc get teg gga aac atg cat gag tta teg ttt ggc att acc agt 3 84 
He Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac cac gee act ggt gcg gtg aga aac ccc tgg aat ccc age tta 
Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ata cca gga ggc teg age ggc ggc gtg get get get gta gca tea egg 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 " ^ 150 155 160 

tta atg etc ggc gga att ggc acc gac acg ggg get teg gtc cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

cct gca tec eta tgt ggc gta gtg gga ttc cgc ccg acg ate ggc aga 576 
Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr He Gly Arg 
180 185 190 

tat cct gga gac cga att gtg ccg gtt age ccc acc cgc gat aca gec 624 
Tyr Pro Gly Asp Arg He Val Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga att ate gca cag age gtt cct gat gtg ata etc ctt gac caa ate 672 
Gly He He Ala Gin Ser Val Pro Asp Val He Leu Leu Asp Gin He 
210 215 220 

att tgc ggg aag etc acg acc cac caa cct gta ccc ctg gag gga tta 720 
He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 * 230 235 240 

cgt ate ggc ttg cca acc act tac ttt tac gat gac ctt gat get gat 7 68 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gec ttc gca get gaa aac ctt ate acg ctg ctg gee age aag ggt 816 
Val Ala Phe Ala Ala Glu Asn Leu He Thr Leu Leu Ala Ser Lys Gly 
260 265 270 

gta acc ttt gtt aag gee gag att cca gat ctg cag cgt ctg aac ate 
Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn He 
275 280 285 



432 



480 



864 
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A # 

ggg gtt age ttt cc WRtt gec ctg tac gag ttt ccg ttc gSc eta caa 912 
Gly Val Ser Phe Pro He Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 
290 295 300 

aag tat ate gat gac ttt gtg aag gat gtg tct ttt tct gac gtc ate 960 
Lys Tyr He Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age cct gat gta gec aac att gee aat get caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Ala Asn Ala Gin He 
325 330 335 

gat gga cat caa att tec aaa get tea tat gaa ctg gcg cga caa tct 1056 
Asp Gly His Gin He Ser Lys Ala Ser Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

ttc aga cca aag ctg caa gec gec tac cat gat tac ttc aag ctg cac 1104 
Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 
355 360 365 

cag eta gac gcg ate ctt ttc ccg aca get ccc ctg aca gec aaa ccg 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

ate ggc caa gat tta teg gtg atg cac aat ggc gta atg gec gac acg 1200 
He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg cga aat gtg gat ccg ggg age aac gca ggc ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

cca gga tta age ctt ccc gtt tct ctt act tea aag ggt ttg cct att 1296 
Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro He 
420 425 430 

gga atg gaa ate gat gga tta gcg ggc atg gac gac cgt ttg eta gca 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 
435 440 445 

ate gga gcg gca eta gag gaa gcg ata get ttt cat aat tta cct gac 1392 
He Gly Ala Ala Leu Glu Glu Ala He Ala Phe His Asn Leu Pro Asp 
450 455 460 

ttc ccg aaa gtc gag aca aac tac tga 1419 
Phe Pro Lys Val Glu Thr Asn Tyr 
465 470 

<210> 36 
<211> 472 
<212> PRT 

<213> Agrobacterium vitis 
<400> 36 

Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 
15 10 15 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr He He Ala Arg Cys 
20 25 30 

Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
35 40 45 

Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 
50 55 60 

Gly Leu Ala Gly He Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 
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lie Phe Pro Ala Se: 




a Ala 



Thr 



Pro Ala 
90 



Leu 



Asp 



Glu 



Leu 
95 



Pro 



85 



Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

lie Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly lie Thr Ser 
115 " 120 125 

Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

lie Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly lie Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr lie Gly Arg 
180 185 190 

Tyr Pro Gly Asp Arg lie Val Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly lie lie Ala Gin Ser Val Pro Asp Val lie Leu Leu Asp Gin lie 
210 215 220 

He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Asn Leu lie Thr Leu Leu Ala Ser Lys Gly 
260 265 270 

Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn lie 
275 280 285 

Gly Val Ser Phe Pro He Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 
290 295 300 

Lys Tyr He Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Ala Asn Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Lys Ala Ser Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro He 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Glu Ala He Ala Phe His Asn Leu Pro Asp 
450 455 460 
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# # 

Phe Pro Lys Val Glu^Kr Asn Tyr 

465 470 

<210> 37 
<211> 1263 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1260) 

<223> coding for 5-methylthioribose kinase 
<400> 37 

atg tct ttt gag gag ttt acg ccg tta aac gag aag tct ctt gta gac 48 
Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 

tac ate aag tea aca cct get etc tct tec aag ate gga gec gac aag 9 6 
Tyr lie Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
20 25 30 

tec gat gat gat ttg gtt ate aaa gaa gtt gga gat ggc aat etc aat 144 
Ser Asp Asp Asp Leu Val He Lys Glu Val Gly Asp Gly Asn Leu Asn 

35 40 45 

ttc gtt ttc ate gtt gtt gga tec tct ggt tct ctt gtc ate aaa cag 192 
Phe Val Phe lie Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 

50 55 60 

get ctt cca tat att cgc tgt ate ggt gaa tea tgg cca atg acg aaa 2 40 
Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 ^ 70 75 80 

gaa aga get tat ttt gaa gca aca act ttg aga aag cat gga aat tta 2 88 
Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 95 

tea cct gat cat gtt cct gaa gtc tac cat ttt gac aga aca atg gcg 336 
Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 
100 105 HO 

ttg att gga atg aga tac ctt gag cct cct cat ate att etc cgc aaa 384 
Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 
115 120 125 

gga etc att get ggg att gag tat cct ttc etc gca gac cac atg tct 432 
Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Asp His Met Ser 

130 135 140 

gat tac atg gcg aag act etc ttc ttc act tct etc etc tat cac gat 480 
Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 
145 150 155 160 

acc aca gag cac aga aga gca gta ace gaa ttt tgt ggt aat gtg gag 528 
Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu . 

165 170 175 

tta tgc cga tta acg gag caa gtt gtg ttt teg gac cca tat aga gtt 576 
Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

tec aca ttt aat cgt tgg act tea cct tat ctt gat gat gat get aag 
Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 
195 200 205 



624 
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get gtg cgc gaa gac^*§t 
Ala Val Arg Glu Asp Ser 
210 

teg atg ttc tgt gaa aga 
Ser Met Phe Cys Glu Arg 
225 230 

act ggt tct gtc atg gtt 
Thr Gly Ser Val Met Val 
245 
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gec ttg aag etc gaa ate gca eta aaa 

Ala Leu Lys Leu Glu lie Ala Glu Leu Lys 
215 220 

get caa get tta ata cat ggt gat ctt cat 

Ala Gin Ala Leu lie His Gly Asp Leu His 

235 240 

act caa gat tea acg caa gtt ata gat cca 

Thr Gin Asp Ser Thr Gin Val lie Asp Pro 

250 255 



gag ttt teg ttc tat gga ccg atg ggt ttc gat att ggc get tat ctt 

Glu Phe Ser Phe Tyr Gly Pro Met Gly Phe Asp lie Gly Ala Tyr Leu 
260 265 270 

ggt aac ttg ata eta get ttc ttt gca caa gat gga cac gec act cag 

Gly Asn Leu lie Leu Ala Phe Phe Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 



gaa aat gat cga aaa 
Glu Asn Asp Arg Lys 
290 

caa act tgg aat ttg 
Gin Thr Trp Asn Leu 
305 

aac aaa gat gga cca 
Asn Lys Asp Gly Pro 
325 



gaa tac aag cag tgg ate ttg aga acc att gag 
Glu Tyr Lys Gin Trp lie Leu Arg Thr lie Glu 
295 300 

ttt aac aaa agg ttc att gcg eta tgg gat caa 
Phe Asn Lys Arg Phe He Ala Leu Trp Asp Gin 
310 315 320 

ggc gaa gca tac ctt gca gat ate tat aac aat 
Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
330 335 



acc gag gtt ttg aag ttt gtt caa gaa aac tac atg agg aat ttg ttg 
Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 
340 345 . 350 

cat gac tea etc gga ttc ggc get gca aag atg att agg aga att gtg 
His Asp Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg lie Val 
355 360 365 

gga gtg gca cat gtt gag gac ttt gaa tea ate gaa gaa gat aag cga 
Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 
370 375 380 

aga get att tgc gag aga agt gca etc gag ttt gcg aag atg ctt etc 
Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 ~ 390 395 400 

aag gaa agg aga aag ttt aag agt ate ggt gaa gtt gtt tea gca att 
Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 
405 410 415 

caa caa caa age taa 
Gin Gin Gin Ser 
420 

<210> 38 
<211> 420 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 38 

Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 

Tyr He Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
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Ser Asp Asp Asp Leu^Tl lie Lys Glu Val Gly Asp Gly AUr Leu Asn 

35 40 45 

Phe Val Phe He Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 

50 55 60 

Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 70 75 80 

Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 95 

Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 

100 105 HO 

Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 

115 120 125 

Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Asp His Met Ser 

130 135 140 

Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 
145 150 155 160 

Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu 
165 170 175 

Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 

195 200 205 

Ala Val Arg Glu Asp Ser Ala Leu Lys Leu Glu He Ala Glu Leu Lys 

210 ~ 215 220 

Ser Met Phe Cys Glu Arg Ala Gin Ala Leu He His Gly Asp Leu His 
225 * 230 235 240 

Thr Gly Ser Val Met Val Thr Gin Asp Ser Thr Gin Val He Asp Pro 
245 250 255 

Glu Phe Ser Phe Tyr Gly Pro Met Gly Phe Asp He Gly Ala Tyr Leu 
260 265 270 

Gly Asn Leu He Leu Ala Phe Phe Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 

Glu Asn Asp Arg Lys Glu Tyr Lys Gin Trp He Leu Arg Thr He Glu 

290 295 300 

Gin Thr Trp Asn Leu Phe Asn Lys Arg Phe He Ala Leu Trp Asp Gin 

305 310 315 320 

Asn Lys Asp Gly Pro Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
325 330 335 

Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 
340 345 350 

His Asp Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg He Val 

355 360 365 

Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 

370 375 380 

Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 ^ 390 395 400 

Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 



405 



410 



415 



WO 2004/013333 ^ PCT/EP2003/007877 

Gin Gin Gin Ser 
420 

<210> 39 
<211> 1200 
<212> DNA 

<213> Klebsiella pneumoniae 

<220> 
<221> CDS 
<222> (I)*. (1197) 

<223> coding for 5-methylthioribose kinase 
<400> 39 

atg teg caa tac cat acc ttc acc gec cac gat gec gtg get tac gcg 48 
Met Ser Gin Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala 
15 10 15 

caa cag ttc gec ggc ate gac aac cca tct gag ctg gtc age gcg cag 96 
Gin Gin Phe Ala Gly lie Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

gaa gtg ggc gat ggc aac etc aat ctg gtg ttt aaa gtg ttc gat cgt 144 
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

cag ggc gtc age egg gcg ate gtc aaa cag gee ctg ccc tac gtg cgc 192 
Gin Gly Val Ser Arg Ala He Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

tgc gtc ggc gaa tec tgg ccg ctg acc etc gac cgc gee cgt etc gaa 240 
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 70 75 80 

gcg cag acc ctg gtc gee cac tat cag cac age ccg cag cac acg gta 288 
Ala Gin Thr Leu Val Ala His Tyr Gin His Ser Pro Gin His Thr Val 

85 90 95 

aaa ate cat cac ttt gat ccc gag ctg gcg gtg atg gtg atg gaa gat 336 
Lys He His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 
100 105 110 

ctt tec gac cac cgc ate tgg cgc gga gag ctt ate get aac gtc tac 384 
Leu Ser Asp His Arg He Trp Arg Gly Glu Leu lie Ala Asn Val Tyr 
115 120 125 

tat ccc cag gcg gee cgc cag ctt ggc gac tat ctg gcg cag gtg ttg 432 
Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 
130 135 140 

ttc cac acc age gat ttc tac etc cat ccc cac gag aaa aag gcg cag 480 
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 160 

gtg gcg cag ttt att aac ccg gcg atg tgc gag ate acc gag gat ctg 528 
Val Ala Gin Phe He Asn Pro Ala Met Cys Glu He Thr Glu Asp Leu 
165 170 175 

ttc ttt aac gac ccg tat cag ate cac gag cgc aat aac tac ccg gcg 576 
Phe Phe Asn Asp Pro Tyr Gin lie His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

gag ctg gag gee gat gtc gee gee ctg cgc gac gac gee cag ctt aag 624 
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 
195 200 205 
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ctg gcg gtg gcg gcg^Kg aag cac cgt ttc ttt gcc cat gaa gcg 672 

Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 
210 215 220 

ctg ctg cac ggc gat ate cac age ggg teg ate ttc gtt gcc gaa ggt 720 
Leu Leu His Gly Asp lie His Ser Gly Ser lie Phe Val Ala Glu Gly 
225 230 235 240 

age ctg aag gcc ate gac gcc gag ttc ggc tac ttc ggc ccc ate ggc 7 68 
Ser Leu Lys Ala lie Asp Ala Glu Phe Gly Tyr Phe Gly Pro lie Gly 
245 250 255 

ttc gat ate ggc ace gcc ate ggc aac ctg ctg ctg aac tac tgc ggc 816 
Phe Asp He Gly Thr Ala He Gly Asn Leu Leu Leu Asn Tyr Cys Gly 
260 265 270 

ctg ccg ggc cag etc ggc att cgc gat gcc gcc gcc gcg cgc gag cag 864 
Leu Pro Gly Gin Leu Gly He Arg Asp Ala Ala Ala Ala Arg Glu Gin 
275 280 285 

egg ctg aac gac ate cac cag ctg tgg acc acc ttc gcc gag cgc ttc 912 
Arg Leu Asn Asp He His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 
290 295 300 

cag gcg ctg gcg gcg gag aaa acc cgc gac gcg gcg ctg get tac ccc 960 
Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

ggc tac gcc tec gcc ttt ctg aag aaa gtc tgg gcg gac gcg gtc ggc 1008 
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

ttc tgc ggc age gaa ctg ate cgc cgc age gtc gga ctg teg cac gtc 1056 
Phe Cys Gly Ser Glu Leu He Arg Arg Ser Val Gly Leu Ser His Val 
340 345 350 

gcg gat ate gac act ate cag gac gac gcc atg cgt cat gag tgc ctg 1104 
Ala Asp He Asp Thr He Gin Asp Asp Ala Met Arg His Glu Cys Leu 
355 360 365 

cgc cac gcc att acc ctg ggc aga gcg ctg ate gtg ctg gcc gag cgt 1152 
Arg His Ala He Thr Leu Gly Arg Ala Leu He Val Leu Ala Glu Arg 
370 375 380 

ate gac age gtc gac gag ctg ctg gcg egg gta cgc cag tac age tga 12 00 
He Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 

<210> 40 
<211> 399 
<212> PRT 

<213> Klebsiella pneumoniae 
<400> 40 

Met Ser Gin Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala 
15 10 15 

Gin Gin Phe Ala Gly He Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

Gin Gly Val Ser Arg Ala He Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 70 75 80 
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Ala Gin Thx 



Leu Va! 



a His Tyr Gin His Ser 
90 



Pro Gin 



Thr Val 
95 



85 



Lys lie His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 
100 105 110 

Leu Ser Asp His Arg lie Trp Arg Gly Glu Leu He Ala Asn Val Tyr 
115 120 125 

Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 
130 135 140 

Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 160 

Val Ala Gin Phe He Asn Pro Ala Met Cys Glu He Thr Glu Asp Leu 
165 170 175 

Phe Phe Asn Asp Pro Tyr Gin He His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 
195 200 205 

Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 
210 215 220 

Leu Leu His Gly Asp He His Ser Gly Ser He Phe Val Ala Glu Gly 
225 230 235 240 

Ser Leu Lys Ala He Asp Ala Glu Phe Gly Tyr Phe Gly Pro He Gly 
245 250 255 

Phe Asp He Gly Thr Ala He Gly Asn Leu Leu Leu Asn Tyr Cys Gly 
260 265 270 

Leu Pro Gly Gin Leu Gly He Arg Asp Ala Ala Ala Ala Arg Glu Gin 
275 280 285 

Arg Leu Asn Asp He His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 
290 295 300 

Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

Phe Cys Gly Ser Glu Leu He Arg Arg Ser Val Gly Leu Ser His Val 
340 345 350 

Ala Asp He Asp Thr He Gin Asp Asp Ala Met Arg His Glu Cys Leu 
355 360 365 

Arg His Ala He Thr Leu Gly Arg Ala Leu lie Val Leu Ala Glu Arg 
370 375 380 

He Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 



<210> 41 
<211> 1140 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
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<400> 41 

atg tct acc acc gga cag att att cga tgc aaa get get gtg gca tgg 48 
Met Ser Thr Thr Gly Gin lie lie Arg Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gaa gec gga aag cca ctg gtg ate gag gaa gtg gag gtt get cca ccg 96 
Glu Ala Gly Lys Pro Leu Val lie Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag aaa cac gaa gtt cgt ate aag att etc ttc act tct etc tgt cac 144 
Gin Lys His Glu Val Arg lie Lys lie Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gat gtt tac ttc tgg gaa get aag gga caa aca ccg ttg ttt cca 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 
50 55 60 

cgt ate ttc ggc cat gaa get gga ggg att gtt gag agt gtt gga gaa 240 
Arg lie Phe Gly His Glu Ala Gly Gly lie Val Glu Ser Val Gly Glu 
65 70 75 80 

gga gtg act gat ctt cag cca gga gat cat gtg ttg ccg ate ttt acc 288 
Gly Val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

gga gaa tgt gga gat tgt cgt cat tgc cag teg gag gaa tea aac atg 336 
Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 
100 105 110 

tgt gat ctt etc agg ate aac aca gag cga gga ggt atg att cac gat 384 
Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met He His Asp 
115 120 125 

ggt gaa tct aga ttc tec att aat ggc aaa cca ate tac cat ttc ctt 432 
Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 
130 135 140 

ggg acg tec acg ttc agt gag tac act gtg gtt cac tct ggt cag gtc 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

get aag ate aat ccg gat get cct ctt gac aag gtc tgt att gtc agt 52 8 
Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 

tgt ggt ttg tct act ggg tta gga gca act ttg aat gtg get aaa ccc 57 6 
Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 
180 185 190 

aag aaa ggt caa agt gtt gee att ttt ggt ctt ggt get gtt ggt tta 624 
Lys Lys Gly Gin Ser Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

ggc get gca gaa ggt get aga ate get ggt get tct agg ate ate ggt 672 
Gly Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtt gat ttt aac tct aaa aga ttc gac caa get aag gaa ttc ggt gtg 72 0 
Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 
225 230 235 240 

acc gag tgt gtg aac ccg aaa gac cat gac aag cca att caa cag gtg 7 68 
Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro He Gin Gin Val 
245 250 255 

ate get gag atg acg gat ggt ggg gtg gac agg agt gtg gaa tgc acc 816 
He Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 
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gga age gtt cag gc^^Ptg att caa gca ttt gaa tgt gtc cBc gat ggc 864 

Gly Ser Val Gin Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt gca gtg ctg gtg ggt gtg cca age aaa gac gat gec ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro Ser Lys Asp Asp Ala Phe 
290 295 300 

aag act cat ccg atg aat ttc ttg aat gag agg act ctt aag ggt act 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggg aac tac aaa ccc aaa act gac att ccc ggg gtt gtg gaa 1008 
Phe Phe Gly Asn Tyr Lys Pro Lys Thr Asp He Pro Gly Val Val Glu 
325 330 335 

aag tac atg aac aag gag ctg gag ctt gag aaa ttc ate act cac aca 1056 
Lys Tyr Met Asn Lys Glu Leu Glu Leu Glu Lys Phe He Thr His Thr 
340 345 350 

gtg cca ttc teg gaa ate aac aag gee ttt gat tac atg ctg aag gga 1104 
Val Pro Phe Ser Glu He Asn Lys Ala Phe Asp Tyr Met Leu Lys Gly 
355 360 365 

gag agt att cgt tgc ate ate ace atg ggt get tga 1140 
Glu Ser He Arg Cys He He Thr Met Gly Ala 
370 375 

<210> 42 

<211> 379 ^ 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 42 

Met Ser Thr Thr Gly Gin He He Arg Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Gly Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Lys His Glu Val Arg He Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met lie His Asp 
115 120 125 

Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 
130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 



Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 
180 185 190 
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Lys Lys Gly Gin Se^Pal Ala lie Phe Gly Leu Gly Ala wtt Gly Leu 

195 200 205 

Gly Ala Ala Glu Gly Ala Arg lie Ala Gly Ala Ser Arg lie lie Gly 
210 215 220 

Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 
225 230 235 240 

Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro lie Gin Gin Val 
245 250 255 

lie Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Ser Val Gin Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro Ser Lys Asp Asp Ala Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Lys Thr Asp He Pro Gly Val Val Glu 
325 330 335 

Lys Tyr Met Asn Lys Glu Leu Glu Leu Glu Lys Phe He Thr His Thr 
340 345 350 

Val Pro Phe Ser Glu He Asn Lys Ala Phe Asp Tyr Met Leu Lys Gly 
355 360 365 

Glu Ser He Arg Cys He He Thr Met Gly Ala 
370 375 



<210> 43 
<211> 1140 
<212> DNA 

<213> Hordeum vulgare 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 43 

atg gcg acg gcc ggc aag gtg ate aag tgc aaa gec gcg gtg gcg tgg 4 8 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gcc ggg aag ccg ctg acc atg gag gag gtg gag gtg gcg ccg ccg 9 6 
Glu Ala Gly Lys Pro Leu Thr Met Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gcc atg gag gtg cgc gtc aag ate etc ttc acc tec etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gcc aag ggg cag acc ccc atg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggc ata gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 
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ggc gtg act gat gtWJcc cct ggt gac cac gtc etc cct gWJ ttc act 2 88 
Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

ggg gag tgt aag gaa tgc cca cat tgc aag tct gcg gag age aac atg 33 6 
Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac acc gac aga ggt gtg atg ate ggg gat 3 84 
Cys Asp Leu Leu Arg lie Asn Thr Asp Arg Gly Val Met lie Gly Asp 
115 120 125 

ggc aag teg cgc ttc tct att ggc ggc aag ccg att tac cat ttc gta 432 
Gly Lys Ser Arg Phe Ser lie Gly Gly Lys Pro lie Tyr His Phe Val 
130 135 140 

ggg act tec acc ttc agt gag tac act gtc atg cat gtc ggt tgt gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

gee aag ate aac cct gag get ccc ctt gat aaa gtc tgt gtt ctt age 528 
Ala Lys lie Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tgc act ggt ctt ggc gcg tea att aat gtt gca aaa cca 576 
Cys Gly lie Cys Thr Gly Leu Gly Ala Ser lie Asn Val Ala Lys Pro 
180 185 190 

cca aag ggt tec aca gtg gcg ata ttt ggg eta gga get gtt ggc ctt 624 
Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get get gca gaa ggt gca agg att gca ggt gca tea agg ate att ggt 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtt gac ctg aac gee age aga ttt gaa gag get agg aag ttt ggc tgc 720 
Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

acg gaa ttt gtg aac ccg aaa gat cac acc aag cca gtt cag cag gtg 7.68 
Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

etc get gac atg aca aat ggc gga gtt gac cgc agt gtt gag tgc act 816 
Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac gtc aat get atg ata caa gca ttt gaa tgt gtt cat gat ggc 864 
Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gta get gtg ctg gtg ggt gtg cca cac aag gac get gaa ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aat gag agg acc ctg aag ggc acc 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggt aac ttc aag ccg cgc act gac ctg ccc aat gtc gtg gag 1008 
Phe Phe Gly Asn Phe Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

atg tac atg aag aag gag ctg gag gtg gag aag ttc ate aca cac age 1056 
Met Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 
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gtg ccg ttc teg ga^Wta aac aag gec ttc gac ctt atg g^y aag ggg 1104 
Val Pro Phe Ser Glu lie Asn Lys Ala Phe Asp Leu Met Ala Lys Gly 
355 360 365 



gag ggc ate cgt tgc ate ate cgc atg gac aac tag 
Glu Gly lie Arg Cys lie lie Arg Met Asp Asn 
370 375 

<210> 44 
<211> 379 
<212> PRT 

<213> Hordeuin vulgar e 
<400> 44 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Gly Lys Pro Leu Thr Met Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Gly Gly Lys Pro He Tyr His Phe Val 
130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Cys Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 



1140 
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Lys Thr His Pro MelBKn Phe Leu Asn Glu Arg Thr Leu Bfs Gly Thr 

305 310 315 320 

Phe Phe Gly Asn Phe Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Met Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe lie Thr His Ser 
340 345 350 

Val Pro Phe Ser Glu lie Asn Lys Ala Phe Asp Leu Met Ala Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Asp Asn 
370 375 



<210> 45 
<211> 1140 
<212> DNA 

<213> Oryza sativa 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 45 

atg gcg acc gca ggg aag gtg ate aag tgc aaa gcg gcg gtg gca tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gec gcg aag ccg ctg gtg ate gag gag gtg gag gtg gcg ccg ccg 9 6 
Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gec atg gag gtg cgc gtc aag ate etc ttc acc teg etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gee aag gga cag act ccc gtg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggt att gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gat ctt gec cct ggt gac cat gtt etc cct gtg ttc act 2 88 
Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

ggg gag tgc aag gag tgt gee cac tgc aag tea gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac act gac agg ggt gtg atg att ggt gat 3 84 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

ggc aaa tea cgc ttt tec ate aac ggg aag ccc att tac cat ttc gtc 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

ggg act teg acc ttc age gag tac act gtc atg cat gtt ggt tgc gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 
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gcg aag ate aac ccgwfca get cca ctt gat aaa gtt tgc UCt ctt age 528 
Ala Lys lie Asn Pro Ala Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tct act ggt ctt ggt get aca ate aat gtg gca aag cca 576 
Cys Gly lie Ser Thr Gly Leu Gly Ala Thr lie Asn Val Ala Lys Pro 
180 185 190 

cca aag ggt teg acg gtg gcg ata ttt ggt - eta gga get gta ggc ctt 624 
Pro Lys Gly Ser Thr Val Ala lie Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get gee gca gaa ggt gca agg att gca gga gcg tea agg ate att ggc 672 
Ala Ala Ala Glu Gly Ala Arg lie Ala Gly Ala Ser Arg lie lie Gly 
210 215 220 

att gac ctg aac gec aac aga ttt gaa gaa get agg aaa ttt ggt tgc 720 
lie Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

act gaa ttt gtg aac cca aag gac cat gac aag cca gtt cag cag gta 7 68 
Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

ctt get gag atg acc aat ggc gga gtt gac cgc age gtt gaa tgc act 816 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aac gee atg ate caa gca ttt gaa tgt gtt cat gat ggc 864 
Gly Asn lie Asn Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt get gtt ttg gtc ggc gtg cca cac aag gac gee gag ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aac gag agg act etc aag gga acc 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggc aac tac aag cca cgc acc gat ctg ccc aac gtc gtc gag 1008 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

etc tac atg aag aag gag ctg gag gtg gag aag ttc ate aca cac age 1056 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe lie Thr His Ser 
340 345 350 

gtg ccg ttc teg gag ate aac acg gcg ttc gac ctg atg cac aag ggc 1104 
Val Pro Phe Ser Glu lie Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

gag ggc ate cgc tgc ate ate cgc atg gag aac tga 1140 
Glu Gly lie Arg Cys lie He Arg Met Glu Asn 
370 375 

<210> 46 
<211> 379 
<212> PRT 

<213> Oryza sativa 
<400> 46 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 



Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 
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Gin Ala Met Glu Va! 
35 



*g Val Lys lie 
40 



Leu 



Phe 



Thr 



Ser 
45 



Cys 



His 



Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys lie Asn Pro Ala Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Thr He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

He Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ser Glu He Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 47 
<211> 1140 
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<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 47 

atg gcg acc gcg ggg aag gtg ate aag tgc aaa get gcg gtg gca tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gec ggc aag cca ctg teg ate gag gag gtg gag gta gcg cct ccg 96 
Glu Ala Gly Lys Pro Leu Ser lie Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gec atg gag gtg cgc gtc aag ate etc ttc acc teg etc tgc cac 14'4 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gec aag ggg cag act ccc gtg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

egg ate ttt ggc cat gag get gga ggt ate ata gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gac gta get ccg ggc gac cat gtc ctt cct gtg ttc act 288 
Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

ggg gag tgc aag gag tgc gec cac tgc aag teg gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ttg etc agg ate aac act gac cgc ggt gtg atg att ggc gat 384 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

ggc aag teg egg ttt tea ate aat ggg aag cct ate tac cac ttt gtt 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

ggg act tec acc ttc age gag tac acc gtc atg cat gtc ggt tgt gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

gca aag ate aac cct cag get ccc ctt gat aaa gtt tgc gtc ctt age 528 
Ala Lys He Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tct act ggt ctt ggt gca tea att aat gtt gca aaa cct 576 
Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

ccg aag ggt teg aca gtg get gtt ttc ggt tta gga gee gtt ggt ctt 624 
Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

gec get gca gaa ggt gca agg att get gga gcg tea agg ate att ggt 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtc gac ctg aac ccc age aga ttc gaa gaa get agg aag ttc ggt tgc 720 
Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 
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act gaa ttt gtg aac^a aaa gac cac aac aag ccg gtg clg gag gta 768 
Thr Glu Phe Val Asn Pro I»ys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

ctt get gag atg acc aac gga ggg gtc gac cgc age gtg gaa tgc act 816 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aat get atg ate caa get ttc gaa tgt gtt cat gat ggc 864 
Gly Asn lie Asn Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt gee gtg ctg gtg ggt gtg ccg cat aag gac get gag ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aac gaa agg acc ctg aag ggg acc 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttt ggc aac tat aag cca cgc act gat ctg cca aat gtg gtg gag 1008 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

ctg tac atg aaa aag gag ctg gag gtg gag aag ttc ate acg cac age 1056 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

gtc ccg ttc gcg gag ate aac aag gcg ttc aac ctg atg gee aag ggg 1104 
Val Pro Phe Ala Glu He Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 
355 360 365 

gag ggc ate cgc tgc ate ate cgc atg gag aac tag 1140 
Glu Gly He Arg Cys lie He Arg Met Glu Asn 
370 375 

<210> 48 
<211> 379 
<212> PRT 
<213> Zea mays 

<400> 48 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Gly Lys Pro Leu Ser He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 HO 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 12 0 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 " 135 140 
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Gly Thr Ser Thr Ph^Wer Glu Tyr Thr Val Met His Val Cys Val 

145 150 155 160 

Ala Lys lie Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 *~ 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ala Glu He Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 49 
<211> 505 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: coding for 
sense RNA-f ragment of E.coli codA gene 

<400> 49 

aagcttggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 
gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 
aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 
cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 
ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 300 
taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 360 
gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 420 
caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg tcgac 505 



<210> 50 
<211> 27 



WO 2004/013333 



PCT7EP2003/007877 



71 



<212> DNA 



<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: 
oligonucleotide primer 

<400> 50 

cgtgaatacg gcgtggagtc g 21 

<210> 51 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 

<400> 51 

cggcaggata atcaggttgg 20 

<210> 52 
<211> 505 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Besclireibung der kunstlichen Sequenz: coding for 
antisense RNA- fragment of E.coli codA gene 

<400> 52 

gaattcggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 

gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 

aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 

cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 

ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 300 

taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 3 60 

gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 42 0 

caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg gatcc 505 

<210> 53 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinst lichen Sequenz: 
oligonucleotide primer 

<400> 53 

gtcaacgtaa ccaaccctgc 2 0 

<210> 54 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: 
oligonucleotide primer 



<400> 54 

ggatccgaca aaatcccttc ctgagg 



26 
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<210> 55 
<211> 5674 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz: vector 
construct pBluKS-nitP-STLSl-35S--T 

<400> 55 

ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 60 
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 120 
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 180 
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 240 
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 3 00 
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 3 60 
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420 
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480 
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540 
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600 
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660 
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720 
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 7 80 
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840 
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 900 
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 9 60 
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020 
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080 
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140 
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200 
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260 
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 132 0 
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380 
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440 
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500 
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560 
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620 
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680 
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740 
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 180 0 
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860 
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 192 0 
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980 
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2 040 
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100 
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160 
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg 222 0 
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 228 0 
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 2340 
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 2400 
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 2460 
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 252 0 
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 2580 
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 2 640 
aaatattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2700 
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 2 7 60 
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 282 0 
attgtaatac gactcactat agggcgaatt ggagctcgtc gagaccagat gttttacact 2 880 
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tgaccgtaaa tgagcacc^^aagaaaccgg tcacattcat ttcgaaggt^^jagaaagcgg 2940 
aagatgactc aaacaagtaa tcggttgtga ttcgtcagtt catgtcactc ctatgaagga 3000 
gtcaagttca aaatgttatg ttgagtttca aacttttatg ctaaactttt tttctttatt 3060 
ttcgttaata atggaagaga accaattctc ttgtatctaa agattatcca tctatcatcc 3120 
aatttgagtg ttcaattctg gatgttgtgt taccctacat tctacaacca tgtagccaat 3180 
tattatgaat ctggctttga tttcagttgt gttcttttct tttttttctt tgcatatttg 3240 
catttagaat gtttaataat taagttactg tatttccaca tacattagtt ccaagaatat 3300 
acatatatta atttattttt cttaaaaatg ttttggaatg actaatattg acaacgaaaa 3360 
tagaagctat gctaaaccat tacgtatatg tgacttcaca tgttgttgtt ttacattccc 3420 
tatatatatg gatggctgtc acaatcagaa acgtgatcga aaaaagacaa acagtgtttg 3480 
cataaaaaga ctatttcgtt tcattgacaa tttgtgttta tttgtaaaga aaagtggcaa 3 540 
agtggaattt gagttcctgc aagtaagaaa gatgaaataa aagacttgag tgtgtgtttt 3 600 
tttcttttat ctgaaagctg caatgaaata ttcctaccaa gcccgtttga ttattaattg 3 660 
gggtttggtt ttcttgatgc gaactaattg gttatataag aaactataca atccatgtta 3720 
attcaaaaat tttgatttct cttgtaggaa tatgatttac tatatgagac tttcttttcg 3780 
ccaataatag taaatccaaa gatatttgac cggaccaaaa cacattgatc tattttttag 3 840 
tttatttaat ccagtttctc tgagataatt cattaaggaa aacttagtat taacccatcc 3900 
taagattaaa taggagccaa actcacattt caaatattaa ataacataaa atggatttaa 3960 
aaaatctata cgtcaaattt tatttatgac atttcttatt taaatttata tttaatgaaa 4020 
tacagctaag acaaaccaaa aaaaaaatac tttctaagtg gtccaaaaca tcaattccgt 4080 
tcaatattat taggtagaat cgtacgacca aaaaaaggta ggttaatacg aattagaaac 4140 
atatctataa catagtatat attattacct attatgagga atcaaaatgc atcaaatatg 4200 
gatttaagga atccataaaa gaataaattc tacgggaaaa aaaatggaat aaattctttt 4260 
aagtttttta tttgtttttt atttggtagt tctccatttt gttttatttc gtttggattt 4320 
attgtgtcca aatactttgt aaaccaccgt tgtaattctt aaacggggtt ttcacttctt 4380 
ttttatattc agacataaag catcggctgg tttaatcaat caatagattt tatttttctt 4440 
ctcaattatt agtaggtttg atgtgaactt tacaaaaaaa acaaaaacaa atcaatgcag 4500 
agaaaagaaa ccacgtgggc tagtcccacc ttgtttcatt tccaccacag gttcgatctt 4560 
cgttaccgtc tccaatagga aaataaacgt gaccacaaaa aaaaaacaaa aaaaagtcta 4620 
tatattgctt ctctcaagtc tctgagtgtc atgaaccaaa gtaaaaaaca aagactcgac 4680 
ctgcaggcat gcaagcttat cgtcgactac gtaagtttct gcttctacct ttgatatata 4740 
tataataatt atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa 4800 
agaatgtagt atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat 4860 
aacttttcta atatatgacc aaaatttgtt gatgtgcagg tatcaccgga tccatcgaat 4920 
tcggtacgct gaaatcacca gtctctctct acaaatctat ctctctctat tttctccata 4980 
aataatgtgt gagtagtttc ccgataaggg gaanttaggg ttcttatagg gtttcgctca 5040 
tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata cttctatcaa 5100 
taaaatttct aattcctaaa accaaaatcc agtactaaaa tccagatctc ctaaagtccc 5160 
tatagatctt tgtcgtgaat ataaaccaga cacgagacga ctaaacctgg agcccagacg 5220 
ccgttcgaag ctagaagtac cgcttaggca ggaggccgtt agggaaaaga tgctaaggca 5280 
gggttggtta cgttgactcc cccgtaggtt tggtttaaat atgatgaagt ggacggaagg 5340 
aaggaggaag acaaggaagg ataaggttgc aggccctgtg caaggtaaga agatggaaat 5400 
ttgatagagg tacgctacta tacttatact atacgctaag ggaatgcttg tatttatacc 5460 
ctataccccc taataacccc ttatcaattt aagaaataat ccgcataagc ccccgcttaa 5520 
aaattggtat cagagccatg aataggtcta tgaccaaaac tcaagaggat aaaacctcac 5580 
caaaatacga aagagttctt aactctaaag ataaaagatc tttcaagatc aaaactagtt 5640 
ccctcacacc ggtgacgggg atcgcgatgg gtac 5 674 

<210> 56 

<211> 6046 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kiinstlichen Sequenz: binary 
vector pSUNl 



<400> 56 

ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 
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. ttattctaat aaacgctc^^tctcttagg tttacccgcc aatatatcct gtcaaacact 120 
gatagtttaa actgaaggcg ggaaacgaca atcagatcta gtaggaaaca gctatgacca 180 
tgattacgcc aagcttgcat gcctgcaggt cgactctaga ctagtggatc cgatatcgcc 240 
cgggctcgag gtaccgagct cgaattcact ggccgtcgtt ttacaacgac tcagctgctt 300 
ggtaataatt gtcattagat tgtttttatg catagatgca ctcgaaatca gccaatttta 360 
gacaagtatc aaacggatgt taattcagta cattaaagac gtccgcaatg tgttattaag 420 
ttgtctaagc gtcaatttgt ttacaccaca atatatcctg ccaccagcca gccaacagct 480 
ccccgaccgg cagctcggca caaaatcacc acgcgttacc accacgccgg ccggccgcat 540 
ggtgttgacc gtgttcgccg gcattgccga gttcgagcgt tccctaatca tcgaccgcac 600 
ccggagcggg cgcgaggccg ccaaggcccg aggcgtgaag tttggccccc gccctaccct 660 
caccccggca cagatcgcgc acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa 720 
agaggcggct gcactgcttg gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag 780 
cgaggaagtg acgcccaccg aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac 840 
cgaggccgac gccctggcgg ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg 900 
caccaggacg gccaggacga accgtttttc attaccgaag agatcgaggc ggagatgatc 960 
gcggccgggt acgtgttcga gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc 1020 
ctggccggtt tgtctgatgc caagctggcg gcctggccgg ccagcttggc cgctgaagaa 1080 
accgagcgcc gccgtctaaa aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg 1140 
gtcgctgcgt atatgatgcg atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg 1200 
ttatcgctgt acttaaccag aaaggcgggt caggcaagac gaccatcgca acccatctag 1260 
cccgcgccct gcaactcgcc ggggccgatg ttctgttagt cgattccgat ccccagggca 1320 
gtgcccgcga ttgggcggcc gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc 1380 
gcccgacgat tgaccgcgac gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg 1440 
gagcgcccca ggcggcggac ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga 1500 
ttccggtgca gccaagccct tacgacatat gggccaccgc cgacctggtg gagctggtta 1560 
agcagcgcat tgaggtcacg gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga 1620 
tcaaaggcac gcgcatcggc ggtgaggttg ccgaggcgct ggccgggtac gagctgccca 1680 
ttcttgagtc ccgtatcacg cagcgcgtga gctacccagg cactgccgcc gccggcacaa 1740 
ccgttcttga atcagaaccc gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg 1800 
aaattaaatc aaaactcatt tgagttaatg aggtaaagag aaaatgagca aaagcacaaa 1860 
cacgctaagt gccggccgtc cgagcgcacg cagcagcaag gctgcaacgt tggccagcct 1920 
ggcagacacg ccagccatga agcgggtcaa ctttcagttg ccggcggagg atcacaccaa 1980 
gctgaagatg tacgcggtac gccaaggcaa gaccattacc gagctgctat ctgaatacat 2040 
cgcgcagcta ccagagtaaa tgagcaaatg aataaatgag tagatgaatt ttagcggcta 2100 
aaggaggcgg catggaaaat caagaacaac caggcaccga cgccgtggaa tgccccatgt 2160 
gtggaggaac gggcggttgg ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg 2220 
gcactggaac ccccaagccc gaggaatcgg cgtgagcggt cgcaaaccat ccggcccggt 2280 
acaaatcggc gcggcgctgg gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc 2340 
ccagcggcaa cgcatcgagg cagaagcacg ccccggtgaa tcgtggcaag cggccgctga 2400 
tcgaatccgc aaagaatccc ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc 2460 
gcccaagggc gacgagcaac cagatttttt cgttccgatg ctctatgacg tgggcacccg 252 0 
cgatagtcgc agcatcatgg acgtggccgt tttccgtctg tcgaagcgtg accgacgagc 2580 
tggcgaggtg atccgctacg agcttccaga cgggcacgta gaggtttccg cagggccggc 2 640 
cggcatggcc agtgtgtggg attacgacct ggtactgatg gcggtttccc atctaaccga 2 700 
atccatgaac cgataccggg aagggaaggg agacaagccc ggccgcgtgt tccgtccaca 2760 
cgttgcggac gtactcaagt tctgccggcg agccgatggc ggaaagcaga aagacgacct 2820 
ggtagaaacc tgcattcggt taaacaccac gcacgttgcc atgcagcgta cgaagaaggc 2 880 
caagaacggc cgcctggtga cggtatccga gggtgaagcc ttgattagcc gctacaagat 2940 
cgtaaagagc gaaaccgggc ggccggagta catcgagatc gagctagctg attggatgta 3 000 
ccgcgagatc acagaaggca agaacccgga cgtgctgacg gttcaccccg attacttttt 3060 
gatcgatccc ggcatcggcc gttttctcta ccgcctggca cgccgcgccg caggcaaggc 312 0 
agaagccaga tggttgttca agacgatcta cgaacgcagt ggcagcgccg gagagttcaa 3180 
gaagttctgt ttcaccgtgc gcaagctgat cgggtcaaat gacctgccgg agtacgattt 3240 
gaaggaggag gcggggcagg ctggcccgat cctagtcatg cgctaccgca acctgatcga 3300 
gggcgaagca tccgccggtt cctaatgtac ggagcagatg ctagggcaaa ttgccctagc 3360 
aggggaaaaa ggtcgaaaag gtctctttcc tgtggatagc acgtacattg ggaacccaaa 3420 
gccgtacatt gggaaccgga acccgtacat tgggaaccca aagccgtaca ttgggaaccg 3480 
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gtcacacatg taagtgac^g atataaaaga gaaaaaaggc gatttttccg^ sctaaaactc 3540 
tttaaaactt attaaaactc ttaaaacccg cctggcctgt gcataactgt ctggccagcg 3600 
cacagccgaa gagctgcaaa aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc 3 660 
cgcttcgcgt cggcctatcg cggccgctgg ccgctcaaaa atggctggcc tacggccagg 3720 
caatctacca gggcgcggac aagccgcgcc gtcgccactc gaccgccggc gcccacatca 3780 
aggcaccctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc 3840 
cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg 3900 
cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg 3960 
gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 4020 
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc 4080 
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 4140 
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 4200 
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 4260 
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 432 0 
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 4380 
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 4440 
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 4500 
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 4560 
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 4620 
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 4680 
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 4740 
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 4800 
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 4860 
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgca 4920 
tgatatatct cccaatttgt gtagggctta ttatgcacgc ttaaaaataa taaaagcaga 4980 
cttgacctga tagtttggct gtgagcaatt atgtgcttag tgcatctaac gcttgagtta 5040 
agccgcgccg cgaagcggcg tcggcttgaa cgaatttcta gctagacatt atttgccgac 5100 
taccttggtg atctcgcctt tcacgtagtg gacaaattct tccaactgat ctgcgcgcga 5160 
ggccaagcga tcttcttctt gtccaagata agcctgtcta gcttcaagta tgacgggctg 522 0 
atactgggcc ggcaggcgct ccattgccca gtcggcagcg acatccttcg gcgcgatttt 52 80 
gccggttact gcgctgtacc aaatgcggga caacgtaagc actacatttc gctcatcgcc 5340 
agcccagtcg ggcggcgagt tccatagcgt taaggtttca tttagcgcct caaatagatc 5400 
ctgttcagga accggatcaa agagttcctc cgccgctgga cctaccaagg caacgctatg 5460 
ttctcttgct tttgtcagca agatagccag atcaatgtcg atcgtggctg gctcgaagat 5520 
acctgcaaga atgtcattgc gctgccattc tccaaattgc agttcgcgct tagctggata 5580 
acgccacgga atgatgtcgt cgtgcacaac aatggtgact tctacagcgc ggagaatctc 5640 
gctctctcca ggggaagccg aagtttccaa aaggtcgttg atcaaagctc gccgcgttgt 5700 
ttcatcaagc cttacggtca ccgtaaccag caaatcaata tcactgtgtg gcttcaggcc 5760 
gccatccact gcggagccgt acaaatgtac ggccagcaac gtcggttcga gatggcgctc 5820 
gatgacgcca actacctctg atagttgagt cgatacttcg gcgatcaccg cttcccccat 5880 
gatgtttaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc tgctccataa 5940 
catcaaacat cgacccacgg cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg 6000 
taccccaaaa aaacagtcat aacaagccat gaaaaccgcc actgcg 6046 

<210> 57 

<211> 9838 

<212> DNA 

<213> Kunstliche Seqiienz 



<223> Beschreibung der kiinst lichen Sequenz: Transgenic 
expression vector for codA dsRNA pSUNl-codA-RNAi 

<400> 57 

cgaattcact ggccgtcgtt ttacaacgac tcagctgctt ggtaataatt gtcattagat 60 

tgtttttatg catagatgca ctcgaaatca gccaatttta gacaagtatc aaacggatgt 120 

taattcagta cattaaagac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt 180 

ttacaccaca atatatcctg ccaccagcca gccaacagct ccccgaccgg cagctcggca 240 

caaaatcacc acgcgttacc accacgccgg ccggccgcat ggtgttgacc gtgttcgccg 3 00 



<220> 
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gcattgccga gttcgagc^c tccctaatca tcgaccgcac ccggagcggg cgcgaggccg 360 
ccaaggcccg aggcgtgaag tttggccccc gccctaccct caccccggca cagatcgcgc 420 
acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa agaggcggct gcactgcttg 480 
gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag cgaggaagtg acgcccaccg 540 
aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac cgaggccgac gccctggcgg 600 
ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg caccaggacg gccaggacga 660 
accgtttttc attaccgaag agatcgaggc ggagatgatc gcggccgggt acgtgttcga 720 
gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc ctggccggtt tgtctgatgc 780 
caagctggcg gcctggccgg ccagcttggc cgctgaagaa accgagcgcc gccgtctaaa 840 
aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg gtcgctgcgt atatgatgcg 900 
atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg ttatcgctgt acttaaccag 960 
aaaggcgggt caggcaagac gaccatcgca acccatctag cccgcgccct gcaactcgcc 1020 
ggggccgatg ttctgttagt cgattccgat ccccagggca gtgcccgcga ttgggcggcc 1080 
gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc gcccgacgat tgaccgcgac 1140 
gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg gagcgcccca ggcggcggac 1200 
ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga ttccggtgca gccaagccct 12 60 
tacgacatat gggccaccgc cgacctggtg gagctggtta agcagcgcat tgaggtcacg 1320 
gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga tcaaaggcac gcgcatcggc 13 80 
ggtgaggttg ccgaggcgct ggccgggtac gagctgccca ttcttgagtc ccgtatcacg 1440 
cagcgcgtga gctacccagg cactgccgcc gccggcacaa ccgttcttga atcagaaccc 1500 
gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg aaattaaatc aaaactcatt 1560 
tgagttaatg aggtaaagag aaaatgagca aaagcacaaa cacgctaagt gccggccgtc 1620 
cgagcgcacg cagcagcaag gctgcaacgt tggccagcct ggcagacacg ccagccatga 1680 
agcgggtcaa ctttcagttg ccggcggagg atcacaccaa gctgaagatg tacgcggtac 1740 
gccaaggcaa gaccattacc gagctgctat ctgaatacat cgcgcagcta ccagagtaaa 1800 
tgagcaaatg aataaatgag tagatgaatt ttagcggcta aaggaggcgg catggaaaat 1860 
caagaacaac caggcaccga cgccgtggaa tgccccatgt gtggaggaac gggcggttgg 1920 
ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg gcactggaac ccccaagccc 19 80 
gaggaatcgg cgtgagcggt cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg 2040 
gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg 2100 
cagaagcacg ccccggtgaa tcgtggcaag cggccgctga tcgaatccgc aaagaatccc 2160 
ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac 2220 
cagatttttt cgttccgatg ctctatgacg tgggcacccg cgatagtcgc agcatcatgg 22 80 
acgtggccgt tttccgtctg tcgaagcgtg accgacgagc tggcgaggtg atccgctacg 2340 
agcttccaga cgggcacgta gaggtttccg cagggccggc cggcatggcc agtgtgtggg 2400 
attacgacct ggtactgatg gcggtttccc atctaaccga atccatgaac cgataccggg 2460 
aagggaaggg agacaagccc ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt 2520 
tctgccggcg agccgatggc ggaaagcaga aagacgacct ggtagaaacc tgcattcggt 2580 
taaacaccac gcacgttgcc atgcagcgta cgaagaaggc caagaacggc cgcctggtga 2 640 
cggtatccga gggtgaagcc ttgattagcc gctacaagat cgtaaagagc gaaaccgggc 2700 
ggccggagta catcgagatc gagctagctg attggatgta ccgcgagatc acagaaggca 2760 
agaacccgga cgtgctgacg gttcaccccg attacttttt gatcgatccc ggcatcggcc 2820 
gttttctcta ccgcctggca cgccgcgccg caggcaaggc agaagccaga tggttgttca 2880 
agacgatcta cgaacgcagt ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc 2940 
gcaagctgat cgggtcaaat gacctgccgg agtacgattt gaaggaggag gcggggcagg 3000 
ctggcccgat cctagtcatg cgctaccgca acctgatcga gggcgaagca tccgccggtt 3060 
cctaatgtac ggagcagatg ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag 312 0 
gtctctttcc tgtggatagc acgtacattg ggaacccaaa gccgtacatt gggaaccgga 3180 
acccgtacat tgggaaccca aagccgtaca ttgggaaccg gtcacacatg taagtgactg 3240 
atataaaaga gaaaaaaggc gatttttccg cctaaaactc tttaaaactt attaaaactc 3300 
ttaaaacccg cctggcctgt gcataactgt ctggccagcg cacagccgaa gagctgcaaa 3360 
aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg 3420 
cggccgctgg ccgctcaaaa atggctggcc tacggccagg caatctacca gggcgcggac 3480 
aagccgcgcc gtcgccactc gaccgccggc gcccacatca aggcaccctg cctcgcgcgt 3 540 
ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 3 600 
ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 3 660 
tgtcggggcg cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact 3720 
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, atgcggcatc agagcaga^^gtactgagag tgcaccatat gcggtgtgaa ataccgcaca 3780 
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc 3840 
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 3900 
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 3960 
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 4020 
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 4080 
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 4140 
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 4200 
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 4260 
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 432 0 
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 4380 
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 4440 
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 4500 
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 4560 
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 462 0 
agtggaacga aaactcacgt taagggattt tggtcatgca tgatatatct cccaatttgt 4680 
gtagggctta ttatgcacgc ttaaaaataa taaaagcaga cttgacctga tagtttggct 4740 
gtgagcaatt atgtgcttag tgcatctaac gcttgagtta agccgcgccg cgaagcggcg 4800 
tcggcttgaa cgaatttcta gctagacatt atttgccgac taccttggtg atctcgcctt 4860 
tcacgtagtg gacaaattct tccaactgat ctgcgcgcga ggccaagcga tcttcttctt 492 0 
gtccaagata agcctgtcta gcttcaagta tgacgggctg atactgggcc ggcaggcgct 4980 
ccattgccca gtcggcagcg acatccttcg gcgcgatttt gccggttact gcgctgtacc 5040 
aaatgcggga caacgtaagc actacatttc gctcatcgcc agcccagtcg ggcggcgagt 5100 
tccatagcgt taaggtttca tttagcgcct caaatagatc ctgttcagga accggatcaa 5160 
agagttcctc cgccgctgga cctaccaagg caacgctatg ttctcttgct tttgtcagca 522 0 
agatagccag atcaatgtcg atcgtggctg gctcgaagat acctgcaaga atgtcattgc 5280 
gctgccattc tccaaattgc agttcgcgct tagctggata acgccacgga atgatgtcgt 5340 
cgtgcacaac aatggtgact tctacagcgc ggagaatctc gctctctcca ggggaagccg 5400 
aagtttccaa aaggtcgttg atcaaagctc gccgcgttgt ttcatcaagc cttacggtca 5460 
ccgtaaccag caaatcaata tcactgtgtg gcttcaggcc gccatccact gcggagccgt 552 0 
acaaatgtac ggccagcaac gtcggttcga gatggcgctc gatgacgcca actacctctg 5580 
atagttgagt cgatacttcg gcgatcaccg cttcccccat gatgtttaac tttgttttag 5640 
ggcgactgcc ctgctgcgta acatcgttgc tgctccataa catcaaacat cgacccacgg 570 0 
cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg taccccaaaa aaacagtcat 5760 
aacaagccat gaaaaccgcc actgcgttcc atggacatac aaatggacga acggataaac 582 0 
cttttcacgc ccttttaaat atccgattat tctaataaac gctcttttct cttaggttta 5880 
cccgccaata tatcctgtca aacactgata gtttaaactg aaggcgggaa acgacaatca 5940 
gatctagtag gaaacagcta tgaccatgat tacgccaagc ttgcatgcct gcaggtcgac 6000 
tctagactag tggatccgat atcgcccggg ctcgaggtac ccatcgcgat ccccgtcacc 6060 
ggtgtgaggg aactagtttt gatcttgaaa gatcttttat ctttagagtt aagaactctt 612 0 
tcgtattttg gtgaggtttt atcctcttga gttttggtca tagacctatt catggctctg 6180 
ataccaattt ttaagcgggg gcttatgcgg attatttctt aaattgataa ggggttatta 6240 
gggggtatag ggtataaata caagcattcc cttagcgtat agtataagta tagtagcgta 630 0 
cctctatcaa atttccatct tcttaccttg cacagggcct gcaaccttat ccttccttgt 6360 
cttcctcctt ccttccgtcc acttcatcat atttaaacca aacctacggg ggagtcaacg 6420 
taaccaaccc tgccttagca tcttttccct aacggcctcc tgcctaagcg gtacttctag 6480 
cttcgaacgg cgtctgggct ccaggtttag tcgtctcgtg tctggtttat attcacgaca 6540 
aagatctata gggactttag gagatctgga ttttagtact ggattttggt tttaggaatt 6600 
agaaatttta ttgatagaag tattttacaa atacaaatac atactaaggg tttcttatat 666 0 
gctcaacaca tgagcgaaac cctataagaa ccctaanttc cccttatcgg gaaactactc 6720 
acacattatt tatggagaaa atagagagag atagatttgt agagagagac tggtgatttc 6780 
agcgtaccga attcggctaa cagtgtcgaa taacgcttta caaacaatta ttaacgcccg 6840 
gttaccaggc gaagaggggc tgtggcagat tcatctgcag gacggaaaaa tcagcgccat 6900 
tgatgcgcaa tccggcgtga tgcccataac tgaaaacagc ctggatgccg aacaaggttt 6960 
agttataccg ccgtttgtgg agccacatat tcacctggac accacgcaaa ccgccggaca 7020 
accgaactgg aatcagtccg gcacgctgtt tgaaggcatt gaacgctggg ccgagcgcaa 7080 
agcgttatta acccatgacg atgtgaaaca acgcgcatgg caaacgctga aatggcagat 7140 



WO 2004/013333 




PCTYEP2003/007877 




78 



tgccaacggc attcagcax^tgcgtaccca tgtcgatgtt tcggatgca^^gctaactgc 7200 
gctgaaagca atgctggaag tgaagcagga agtcgcgccg tggattgatc tgcaaatcgt 7260 
cgccttccct caggaaggga ttttgtcgga tccggtgata cctgcacatc aacaaatttt 7320 
ggtcatatat tagaaaagtt ataaattaaa atatacacac ttataaacta cagaaaagca 7380 
attgctatat actacattct tttattttga aaaaaatatt tgaaatatta tattactact 7440 
aattaatgat aattattata tatatatcaa aggtagaagc agaaacttac gtagtcgacg 7500 
acaaaatccc ttcctgaggg aaggcgacga tttgcagatc aatccacggc gcgacttcct 7560 
gcttcacttc cagcattgct ttcagcgcag ttagcgttgc atccgaaaca tcgacatggg 7620 
tacgcacatg ctgaatgccg ttggcaatct gccatttcag cgtttgccat gcgcgttgtt 7680 
tcacatcgtc atgggttaat aacgctttgc gctcggccca gcgttcaatg ccttcaaaca 7740 
gcgtgccgga ctgattccag ttcggttgtc cggcggtttg cgtggtgtcc aggtgaatat 7 800 
gtggctccac aaacggcggt ataactaaac cttgttcggc atccaggctg ttttcagtta 7860 
tgggcatcac gccggattgc gcatcaatgg cgctgatttt tccgtcctgc agatgaatct 7920 
gccacagccc ctcttcgcct ggtaaccggg cgttaataat tgtttgtaaa gcgttattcg 7980 
acactgttag ccaagcttgc atgcctgcag gtcgagtctt tgttttttac tttggttcat 8040 
gacactcaga gacttgagag aagcaatata tagacttttt tttgtttttt ttttgtggtc 8100 
acgtttattt tcctattgga gacggtaacg aagatcgaac ctgtggtgga aatgaaacaa 8160 
ggtgggacta gcccacgtgg tttcttttct ctgcattgat ttgtttttgt tttttttgta 8220 
aagttcacat caaacctact aataattgag aagaaaaata aaatctattg attgattaaa 8280 
ccagccgatg ctttatgtct gaatataaaa aagaagtgaa aaccccgttt aagaattaca 8340 
acggtggttt acaaagtatt tggacacaat aaatccaaac gaaataaaac aaaatggaga 8400 
actaccaaat aaaaaacaaa taaaaaactt aaaagaattt attccatttt ttttcccgta 8460 
gaatttattc ttttatggat tccttaaatc catatttgat gcattttgat tcctcataat 852 0 
aggtaataat atatactatg ttatagatat gtttctaatt cgtattaacc tacctttttt 8580 
tggtcgtacg attctaccta ataatattga acggaattga tgttttggac cacttagaaa 8640 
gtattttttt tttggtttgt cttagctgta tttcattaaa tataaattta aataagaaat 8700 
gtcataaata aaatttgacg tatagatttt ttaaatccat tttatgttat ttaatatttg 8760 
aaatgtgagt ttggctccta tttaatctta ggatgggtta atactaagtt ttccttaatg 8820 
aattatctca gagaaactgg attaaataaa ctaaaaaata gatcaatgtg ttttggtccg 8880 
gtcaaatatc tttggattta ctattattgg cgaaaagaaa gtctcatata gtaaatcata 8940 
ttcctacaag agaaatcaaa atttttgaat taacatggat tgtatagttt cttatataac 9000 
caattagttc gcatcaagaa aaccaaaccc caattaataa tcaaacgggc ttggtaggaa 9060 
tatttcattg cagctttcag ataaaagaaa aaaacacaca ctcaagtctt ttatttcatc 9120 
tttcttactt gcaggaactc aaattccact ttgccacttt tctttacaaa taaacacaaa 9180 
ttgtcaatga aacgaaatag tctttttatg caaacactgt ttgtcttttt tcgatcacgt 9240 
ttctgattgt gacagccatc catatatata gggaatgtaa aacaacaaca tgtgaagtca 9300 
catatacgta atggtttagc atagcttcta ttttcgttgt caatattagt cattccaaaa 93 60 
catttttaag aaaaataaat taatatatgt atattcttgg aactaatgta tgtggaaata 9420 
cagtaactta attattaaac attctaaatg caaatatgca aagaaaaaaa agaaaagaac 9480 
acaactgaaa tcaaagccag attcataata attggctaca tggttgtaga atgtagggta 9540 
acacaacatc cagaattgaa cactcaaatt ggatgataga tggataatct ttagatacaa 9600 
gagaattggt tctcttccat tattaacgaa aataaagaaa aaaagtttag cataaaagtt 9 660 
tgaaactcaa cataacattt tgaacttgac tccttcatag gagtgacatg aactgacgaa 9720 
tcacaaccga ttacttgttt gagtcatctt ccgctttctc caccttcgaa atgaatgtga 9780 
ccggtttctt cgggtgctca tttacggtca agtgtaaaac atctggtctc gacgagct 983 8 

<210> 58 
<211> 14184 
<212> DNA 

<213> Kunstliche Sequenz 



<223> Beschreibung der kurist lichen Sequenz: Expression 
vector pSUNl-codA-RNAi-At .Act . -2-At . Als-R-ocsT 

<400> 58 

ctgcttggta ataattgtca ttagattgtt tttatgcata gatgcactcg aaatcagcca 60 
attttagaca agtatcaaac ggatgttaat tcagtacatt aaagacgtcc gcaatgtgtt 120 
attaagttgt ctaagcgtca atttgtttac accacaatat atcctgccac cagccagcca 180 



<220> 
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acagctcccc gaccggcag^^cggcacaaa atcaccacgc gttaccacca^cgccggccgg 240 
ccgcatggtg ttgaccgtgt tcgccggcat tgccgagttc gagcgttccc taatcatcga 3 00 
ccgcacccgg agcgggcgcg aggccgccaa ggcccgaggc gtgaagtttg gcccccgccc 3 60 
taccctcacc ccggcacaga tcgcgcacgc ccgcgagctg atcgaccagg aaggccgcac 420 
cgtgaaagag gcggctgcac tgcttggcgt gcatcgctcg accctgtacc gcgcacttga 480 
gcgcagcgag gaagtgacgc ccaccgaggc caggcggcgc ggtgccttcc gtgaggacgc 540 
attgaccgag gccgacgccc tggcggccgc cgagaatgaa cgccaagagg aacaagcatg 600 
aaaccgcacc aggacggcca ggacgaaccg tttttcatta ccgaagagat cgaggcggag 660 
atgatcgcgg ccgggtacgt gttcgagccg cccgcgcacg tctcaaccgt gcggctgcat 720 
gaaatcctgg ccggtttgtc tgatgccaag ctggcggcct ggccggccag cttggccgct 780 
gaagaaaccg agcgccgccg tctaaaaagg tgatgtgtat ttgagtaaaa cagcttgcgt 840 
catgcggtcg ctgcgtatat gatgcgatga gtaaataaac aaatacgcaa ggggaacgca 900 
tgaaggttat cgctgtactt aaccagaaag gcgggtcagg caagacgacc atcgcaaccc 9 60 
atctagcccg cgccctgcaa ctcgccgggg ccgatgttct gttagtcgat tccgatcccc 1020 
agggcagtgc ccgcgattgg gcggccgtgc gggaagatca accgctaacc gttgtcggca 1080 
tcgaccgccc gacgattgac cgcgacgtga aggccatcgg ccggcgcgac ttcgtagtga 1140 
tcgacggagc gccccaggcg gcggacttgg ctgtgtccgc gatcaaggca gccgacttcg 1200 
tgctgattcc ggtgcagcca agcccttacg acatatgggc caccgccgac ctggtggagc 1260 
tggttaagca gcgcattgag gtcacggatg gaaggctaca agcggccttt gtcgtgtcgc 1320 
gggcgatcaa aggcacgcgc atcggcggtg aggttgccga ggcgctggcc gggtacgagc 1380 
tgcccattct tgagtcccgt atcacgcagc gcgtgagcta cccaggcact gccgccgccg 1440 
gcacaaccgt tcttgaatca gaacccgagg gcgacgctgc ccgcgaggtc caggcgctgg 1500 
ccgctgaaat taaatcaaaa ctcatttgag ttaatgaggt aaagagaaaa tgagcaaaag 1560 
cacaaacacg ctaagtgccg gccgtccgag cgcacgcagc agcaaggctg caacgttggc 1620 
cagcctggca gacacgccag ccatgaagcg ggtcaacttt cagttgccgg cggaggatca 1680 
caccaagctg aagatgtacg cggtacgcca aggcaagacc attaccgagc tgctatctga 1740 
atacatcgcg cagctaccag agtaaatgag caaatgaata aatgagtaga tgaattttag 1800 
cggctaaagg aggcggcatg gaaaatcaag aacaaccagg caccgacgcc gtggaatgcc 1860 
ccatgtgtgg aggaacgggc ggttggccag gcgtaagcgg ctgggttgtc tgccggccct 1920 
gcaatggcac tggaaccccc aagcccgagg aatcggcgtg agcggtcgca aaccatccgg 1980 
cccggtacaa atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca 2040 
ggccgcccag cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc 2100 
cgctgatcga atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag 2160 
gaagccgccc aagggcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg 2220 
cacccgcgat agtcgcagca tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg 2280 
acgagctggc gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg 2340 
gccggccggc atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct 2400 
aaccgaatcc atgaaccgat accgggaagg gaagggagac aagcccggcc gcgtgttccg 2460 
tccacacgtt gcggacgtac tcaagttctg ccggcgagcc gatggcggaa agcagaaaga 2 520 
cgacctggta gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa 2580 
gaaggccaag aacggccgcc tggtgacggt atccgagggt gaagccttga ttagccgcta 2640 
caagatcgta aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tagctgattg 2700 
gatgtaccgc gagatcacag aaggcaagaa cccggacgtg ctgacggttc accccgatta 2760 
ctttttgatc gatcccggca tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg 2 820 
caaggcagaa gccagatggt tgttcaagac gatctacgaa cgcagtggca gcgccggaga 2880 
gttcaagaag ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta 2940 
cgatttgaag gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct accgcaacct 3000 
gatcgagggc gaagcatccg ccggttccta atgtacggag cagatgctag ggcaaattgc 3 060 
cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt acattgggaa 312 0 
cccaaagccg tacattggga accggaaccc gtacattggg aacccaaagc cgtacattgg 3180 
gaaccggtca cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta 3240 
aaactcttta aaacttatta aaactcttaa aacccgcctg gcctgtgcat aactgtctgg 33 00 
ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg 33 60 
ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg 342 0 
gccaggcaat ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc gccggcgccc 3480 
acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 3540 
agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc 3 600 
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agggcgcgtc agcgggtg^r ggcgggtgtc ggggcgcagc 
atagcggagt gtatactggc ttaactatgc ggcatcagag 
ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 
agctcactca aaggcggtaa tacggttatc cacagaatca 
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 
tttccatagg ctccgccccc ctgacgagca tcacaaaaat 
gcgaaacccg acaggactat aaagatacca ggcgtttccc 
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 
cgtggcgctt tctcatagct cacgctgtag gtatctcagt 
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 
taacaggatt agcagagcga ggtatgtagg cggtgctaca 
taactacggc tacactagaa ggacagtatt tggtatctgc 
cttcggaaaa agagttggta gctcttgatc cggcaaacaa 
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 
gatcttttct acggggtctg acgctcagtg gaacgaaaac 
catgcatgat atatctccca atttgtgtag ggcttattat 
agcagacttg acctgatagt ttggctgtga gcaattatgt 
gagttaagcc gcgccgcgaa gcggcgtcgg cttgaacgaa 
gccgactacc ttggtgatct cgcctttcac gtagtggaca 
gcgcgaggcc aagcgatctt cttcttgtcc aagataagcc 
gggctgatac tgggccggca ggcgctccat tgcccagtcg 
gattttgccg gttactgcgc tgtaccaaat gcgggacaac 
atcgccagcc cagtcgggcg gcgagttcca tagcgttaag 
tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc 
cttgcttttg tcagcaagat agccagatca 
gcaagaatgt cattgcgctg ccattctcca 
cacggaatga tgtcgtcgtg cacaacaatg 
tctccagggg aagccgaagt ttccaaaagg 
tcaagcctta cggtcaccgt aaccagcaaa 
tccactgcgg agccgtacaa atgtacggcc 
acgccaacta cctctgatag ttgagtcgat 
ccccatgatg tttaactttg ttttagggcg actgccctgc 
ccataacatc aaacatcgac ccacggcgta acgcgcttgc 
agactgtacc ccaaaaaaac agtcataaca agccatgaaa 
acatacaaat ggacgaacgg ataaaccttt tcacgccctt 
ataaacgctc ttttctctta ggtttacccg ccaatatatc 
aaactgaagg cgggaaacga caatcagatc tagtaggaaa 
ccaagcttgc atgcctgcag gtcgactcta gactagtgga 
aggtacccat cgcgatcccc gtcaccggtg tgagggaact 
ttttatcttt agagttaaga actctttcgt attttggtga 
tggtcataga cctattcatg gctctgatac caatttttaa 
tttcttaaat tgataagggg ttattagggg gtatagggta 
gcgtatagta taagtatagt agcgtacctc tatcaaattt 
gggcctgcaa ccttatcctt ccttgtcttc ctccttcctt 
aaaccaaacc tacgggggag tcaacgtaac caaccctgcc 
gcctcctgcc taagcggtac ttctagcttc gaacggcgtc 
ctcgtgtctg gtttatattc acgacaaaga tctataggga 
agtactggat tttggtttta ggaattagaa attttattga 
aaatacatac taagggtttc ttatatgctc aacacatgag 
aatttccctt atcgggaaac tactcacaca ttatttatgg 
tttgtagaga gagactggtg atttcagcgt accgaattcg 
aataacgctt tacaaacaat tattaacgcc cggttaccag 
attcatctgc aggacggaaa aatcagcgcc attgatgcgc 
actgaaaaca gcctggatgc cgaacaaggt ttagttatac 
attcacctgg acaccacgca aaccgccgga caaccgaact 
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gctatgttct 
gaagatacct 
tggataacgc 
aatctcgctc 
cgttgtttca 
caggccgcca 
gcgctcgatg 



catgacccag 
cagattgtac 
aaataccgca 
cggctgcggc 

ggggata'acg 

aaggccgcgt 

cgacgctcaa 

cctggaagct 

gcctttctcc 

tcggtgtagg 

cgctgcgcct 

ccactggcag 

gagttcttga 

gctctgctga 

accaccgctg 

ggatctcaag 

tcacgttaag 

gcacgcttaa 

gcttagtgca 

tttctagcta 

aattcttcca 

tgtctagctt 

gcagcgacat 

gtaagcacta 

gtttcattta 

gctggaccta 

atgtcgatcg 

aattgcagtt 

gtgacttcta 

tcgttgatca 

tcaatatcac 

agcaacgtcg 

acttcggcga 

tgcgtaacat 

tgcttggatg 

accgccactg 

ttaaatatcc 

ctgtcaaaca 

cagctatgac 

tccgatatcg 

agttttgatc 

ggttttatcc 

gcgggggctt 

taaatacaag 

ccatcttctt 

ccgtccactt 

ttagcatctt 

tgggctccag 

ctttaggaga 

tagaagtatt 

cgaaacccta 

agaaaataga 

attttcggct 

gcgaagaggg 

aatccggcgt 

cgccgtttgt 

ggaatcagtc 



tcacgtagcg 

tgagagtgca 

tcaggcgctc 

gagcggtatc 

caggaaagaa 

tgctggcgtt 

gtcagaggtg 

ccctcgtgcg 

cttcgggaag 

tcgttcgctc 

tatccggtaa 

cagccactgg 

agtggtggcc 

agccagttac 

gtagcggtgg 

aagatccttt 

ggattttggt 

aaataataaa 

tctaacgctt 

gacattattt 

actgatctgc 

caagtatgac 

ccttcggcgc 

catttcgctc 

gcgcctcaaa 

ccaaggcaac 

tggctggctc 

cgcgcttagc 

cagcgcggag 

aagctcgccg 

tgtgtggctt 

gttcgagatg 

tcaccgcttc 

cgttgctgct 

cccgaggcat 

cgttccatgg 

gattattcta 

ctgatagttt 

catgattacg 

cccgggctcg 

ttgaaagatc 

tcttgagttt 

atgcggatta 

cattccctta 

accttgcaca 

catcatattt 

ttccctaacg 

gtttagtcgt 

tctggatttt 

ttacaaatac 

taagaaccct 

gagagataga 

aacagtgtcg 

gctgtggcag 

gatgcccata 

ggagccacat 

cggcacgctg 



3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 
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tttgaaggca ttgaacgcSg ggccgagcgc 
caacgcgcat ggcaaacgct gaaatggcag 
catgtcgatg tttcggatgc aacgctaact 
gaagtcgcgc cgtggattga tctgcaaatc 
gatccggtga tacctgcaca tcaacaaatt 
aaatatacac acttataaac tacagaaaag 
gaaaaaaata tttgaaatat tatattacta 
aaaggtagaa gcagaaactt acgtagtcga 
gatttgcaga tcaatccacg gcgcgacttc 
agttagcgtt gcatccgaaa catcgacatg 
ctgccatttc agcgtttgcc atgcgcgttg 
gcgctcggcc cagcgttcaa tgccttcaaa 
tccggcggtt tgcgtggtgt ccaggtgaat 
accttgttcg gcatccaggc tgttttcagt 
ggcgctgatt tttccgtcct gcagatgaat 
ggcgttaata attgtttgta aagcgttatt 
aggtcgactc tagaggatcc ccgatccact 
cactcagaga cttgagagaa gcaatatata 
gtttattttc ctattggaga cggtaacgaa 
tgggactagc ccacgtggtt tcttttctct 
gttcacatca aacctactaa taattgagaa 
agccgatgct ttatgtctga atataaaaaa 
ggtggtttac aaagtatttg gacacaataa 
taccaaataa aaaacaaata aaaaacttaa 
atttattctt ttatggattc cttaaatcca 
gtaataatat atactatgtt atagatatgt 
gtcgtacgat tctacctaat aatattgaac 
attttttttt tggtttgtct tagctgtatt 
cataaataaa atttgacgta tagatttttt 
atgtgagttt ggctcctatt taatcttagg 
ttatctcaga gaaactggat taaataaact 
caaatatctt tggatttact attattggcg 
cctacaagag aaatcaaaat ttttgaatta 
attagttcgc atcaagaaaa ccaaacccca 
tttcattgca gctttcagat aaaagaaaaa 
tcttacttgc aggaactcaa attccacttt 
gtcaatgaaa cgaaatagtc tttttatgca 
ctgattgtga cagccatcca tatatatagg 
tatacgtaat ggtttagcat agcttctatt 
tttttaagaa aaataaatta atatatgtat 
gtaacttaat tattaaacat tctaaatgca 
aactgaaatc aaagccagat tcataataat 
acaacatcca gaattgaaca ctcaaattgg 
gaattggttc tcttccatta ttaacgaaaa 
aaactcaaca taacattttg aacttgactc 
acaaccgatt acttgtttga gtcatcttcc 
ggtttcttcg ggtgctcatt tacggtcaag 
accgaatcga agtacaactt agctcttgct 
taccgagctc gaattcactg gccgtcgttt 
aaaatttaga acgaacttaa ttatgatctc 
taggttatca ttatgtaaga aagttttgac 
atgtaattgg tatctcaact caacattata 
aaacaactat tttttatgta tgcaagagtc 
tgacgagttc ggatgtagta gtagccatta 
atatgatgaa acattgtatc ttattgtata 
ttctttcacg gtctgaatta attatgatac 
tgaattgtat gaaatctaat tgaacaagcc 



81 

aaagcgttat 
attgccaacg 
gcgctgaaag 
gtcgccttcc 
ttggtcatat 
caattgctat 
ctaattaatg 
cgacaaaatc 
ctgcttcact 
ggtacgcaca 
tttcacatcg 
cagcgtgccg 
atgtggctcc 
tatgggcatc 
ctgccacagc 
cgacactgtt 
cgagtctttg 
gacttttttt 
gatcgaacct 
gcattgattt 
gaaaaataaa 
gaagtgaaaa 
atccaaacga 
aagaatttat 
tatttgatgc 
ttctaattcg 
ggaattgatg 
tcattaaata 
aaatccattt 
atgggttaat 
aaaaaataga 
aaaagaaagt 
acatggattg 
attaataatc 
aacacacact 
gccacttttc 
aacactgttt 
gaatgtaaaa 
ttcgttgtca 
attcttggaa 
aatatgcaaa 
tggctacatg 
atgatagatg 
taaagaaaaa 
cttcatagga 
gctttctcca 
tgtaaaacat 
acatcaccaa 
tacaacgact 
aaatacattg 
gaatatggca 
cttataccaa 
agcatatgta 
tttaatgtac 
aatatccata 
aattctaata 
aaccacgacg 
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taacccatga 
gcattcagca 
caatgctgga 
ctcaggaagg 
attagaaaag 
atactacatt 
ataattatta 
ccgtcctgag 
tccagcattg 
tgctgaatgc 
tcatgggtta 
gactgattcc 
acaaacggcg 
acgccggatt 
ccctcttcgc 
agccaagctt 
ttttttactt 
tgtttttttt 
gtggtggaaa 
gtttttgttt 
atctattgat 
ccccgtttaa 
aataaaacaa 
tccatttttt 
attttgattc 
tattaaccta 
ttttggacca 
taaatttaaa 
tatgttattt 
actaagtttt 
tcaatgtgtt 
ctcatatagt 
tatagtttct 
aaacgggctt 
caagtctttt 
tttacaaata 
gtcttttttc 
caacaacatg 
atattagtca 
ctaatgtatg 
gaaaaaaaag 
gttgtagaat 
gataatcttt 
aagtttagca 
gtgacatgaa 
ccttcgaaat 
ctggtctcga 
gatcttgatg 
cagcacgcgt 
atacatatct 
cgacaaaatg 
acattagtta 
taattgattc 
atactaatcg 
aacacatcat 
gaaaacgaat 
acgactaacg 



cgatgtgaaa 
tgtgcgtacc 
agtgaagcag 
gattttgtcg 
ttataaatta 
cttttatttt 
tatatatatc 
ggaaggcgac 
ctttcagcgc 
cgttggcaat 
ataacgcttt 
agttcggttg 
gtataactaa 
gcgcatcaat 
ctggtaaccg 
gcatgcctgc 
tggttcatga 
ttgtggtcac 
tgaaacmagg 
tttytgtaaa 
tgattaaacc 
gaattacaac 
aatggagaac 
ttcccgtaga 
ctcataatag 
cctttttttg 
cttagaaagt 
taagaaatgt 
aatatttgaa 
ccttaatgaa 
ttggtccggt 
aaatcatatt 
tatataacca 
ggtaggaata 
atttcatctt 
aacacaaatt 
gatcacgttt 
tgaagtcaca 
ttccaaaaca 
tggaaataca 
aaaagaacac 
gtagggtaac 
agatacaaga 
taaaagtttg 
ctgacgaatc 
gaatgtgacc 
gtaatgtcca 
ggggatcggg 
tggtttcgac 
catctagatc 
gctagactcg 
gacaaaattt 
agaatcgttt 
tgaatagtga 
gaaagacact 
taaattacgt 
ttgcctggat 



7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240- 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 

10080 

10140 

10200 

10260 

10320 

10380 

10440 
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tgactcggtt 



taagtta; 



actaaaaaaa 



cggagctgtc 



atgtaacacg 



cggatcgagc 



10500 



aggtcacagt catgaagcca tcaaagcaaa agaactaatc caagggctga gatgattaat 10560 
tagtttaaaa attagttaac acgagggaaa aggctgtctg acagccaggt cacgttatct 10620 
ttacctgtgg tcgaaatgat tcgtgtctgt cgattttaat tatttttttg aaaggccgaa 10680 
aataaagttg taagagataa acccgcctat ataaattcat atattttcct ctccgctttg 10740 
aattgtctcg ttgtcctcct cactttcatc agccgttttg aatctccggc gacttgacag 10800 
agaagaacaa ggaagaagac taagagagaa agtaagagat aatccaggag attcattctc 10860 
cgttttgaat cttcctcaat ctcatcttct tccgctcttt ctttccaagg taataggaac 10920 
tttctggatc tactttattt gctggatctc gatcttgttt tctcaatttc cttgagatct 10980 
ggaattcgtt taatttggat ctgtgaacct ccactaaatc ttttggtttt actagaatcg 11040 
atctaagttg accgatcagt tagctcgatt atagctacca gaatttggct tgaccttgat 11100 
ggagagatcc atgttcatgt tacctgggaa atgatttgta tatgtgaatt gaaatctgaa 11160 
ctgttgaagt tagattgaat ctgaacactg tcaatgttag attgaatctg aacactgttt 11220 
aaggttagat gaagtttgtg tatagattct tcgaaacttt aggatttgta gtgtcgtacg 11280 
ttgaacagaa agctatttct gattcaatca gggtttattt gactgtattg aactcttttt 11340 
gtgtgtttgc agctcataaa aaaaacgcga acctgcaggc atggcggcgg caacaacaac 11400 
aacaacaaca tcttcttcga tctccttctc caccaaacca tctccttcct cctccaaatc 11460 
accattacca atctccagat tctccctccc attctcccta aaccccaaca aatcatcctc 11520 
ctcctcccgc cgccgcggta tcaaatccag ctctccctcc tccatctccg ccgtgctcaa 11580 
cacaaccacc aatgtcacaa ccactccctc tccaaccaaa cctaccaaac ccgaaacatt 11640 
catctcccga ttcgctccag atcaaccccg caaaggcgct gatatcctcg tcgaagcttt 11700 
agaacgtcaa ggcgtagaaa ccgtattcgc ttaccctgga ggtgcatcaa tggagattca 11760 
ccaagcctta acccgctctt cctcaatccg taacgtcctt cctcgtcacg aacaaggagg 11820 
tgtattcgca gcagaaggat acgctcgatc ctcaggtaaa ccaggtatct gtatagccac 11880 
ttcaggtccc ggagctacaa atctcgttag cggattagcc gatgcgttgt tagatagtgt 11940 
tcctcttgta gcaatcacag gacaagtccc tcgtcgtatg attggtacag atgcgtttca 12000 
agagactccg attgttgagg taacgcgttc gattacgaag cataactatc ttgtgatgga 12060 
tgttgaagat atccctagga ttattgagga agctttcttt ttagctactt ctggtagacc 12120 
tggacctgtt ttggttgatg ttcctaaaga tattcaacaa cagcttgcga ttcctaattg 12180 
ggaacaggct atgagattac ctggttatat gtctaggatg cctaaacctc cggaagattc 12240 
tcatttggag cagattgtta ggttgatttc tgagtctaag aagcctgtgt tgtatgttgg 12300 
tggtggttgt ttgaattcta gcgatgaatt gggtaggttt gttgagctta cggggatccc 123 60 
tgttgcgagt acgttgatgg ggctgggatc ttatccttgt gatgatgagt tgtcgttaca 12420 
tatgcttgga atgcatggga ctgtgtatgc aaattacgct gtggagcata gtgatttgtt 12480 
gttggcgttt ggggtaaggt ttgatgatcg tgtcacgggt aagcttgagg cttttgctag 12540 
tagggctaag attgttcata ttgatattga ctcggctgag attgggaaga ataagactcc 12600 
tcatgtgtct gtgtgtggtg atgttaagct ggctttgcaa gggatgaata aggttcttga 12660 
gaaccgagcg gaggagctta agcttgattt tggagtttgg aggaatgagt tgaacgtaca 12720 
gaaacagaag tttccgttga gctttaagac gtttggggaa gctattcctc cacagtatgc 12780 
gattaaggtc cttgatgagt tgactgatgg aaaagccata ataagtactg gtgtcgggca 12840 
acatcaaatg tgggcggcgc agttctacaa ttacaagaaa ccaaggcagt ggctatcatc 12900 
aggaggcctt ggagctatgg gatttggact tcctgctgcg attggagcgt ctgttgctaa 12960 
ccctgatgcg atagttgtgg atattgacgg agatggaagc tttataatga atgtgcaaga 13020 
gctagccact attcgtgtag agaatcttcc agtgaaggta cttttattaa acaaccagca 13080 
tcttggcatg gttatgcaat gggaagatcg gttctacaaa gctaaccgag ctcacacatt 13140 
tctcggggat ccggctcagg aggacgagat attcccgaac atgttgctgt ttgcagcagc 13200 
ttgcgggatt ccagcggcga gggtgacaaa gaaagcagat ctccgagaag ctattcagac 132 60 
aatgctggat acaccaggac cttacctgtt ggatgtgatt tgtccgcacc aagaacatgt 13320 
gttgccgatg atcccgaatg gtggcacttt caacgatgtc ataacggaag gagatggccg 13380 
gattaaatac tgagagatga aaccggcctg gccggcccgg agtggggagg cacgatggcc 13440 
gctttggtcg atcgacggga tcgatcctgc tttaatgaga tatgcgagac gcctatgatc 13500 
gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa aaacctgagc atgtgtagct 13560 
cagatcctta ccgccggttt cggttcattc taatgaatat atcacccgtt actatcgtat 13620 
ttttatgaat aatattctcc gttcaattta ctgattgtac cctactactt atatgtacaa 13680 
tattaaaatg aaaacaatat attgtgctga ataggtttat agcgacatct atgatagagc 13740 
gccacaataa caaacaattg cgttttatta ttacaaatcc aattttaaaa aaagcggcag 13800 
aaccggtcaa acctaaaaga ctgattacat aaatcttatt caaatttcaa aaggccccag 13860 
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aactaataac 
cttgaagttg 
ccagcacggc 
gtatgtgggc 
gggtccaggg 
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gttcactgaS^jggaactccg 
agtattggcc gtccgctcta 
ggccgggtaa ccgacttgct 
cccaaatgaa gtgcaggtca 
cgaattttgc gacaacatgt 



gggctagtat ctacgacacSr ccgagcggcg 
gttccccgcc ggcgcgcatg ggtgagattc 
ccgaaagtta cgggcaccat tcaacccggt 
gccccgagaa ttatgcagca tttttttggt 
aaccttgaca gtgacgacaa atcgttgggc 
cgaggctcag caggatgggc ccag 

<210> 59 

<211> 1011 

<212> DNA 

<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (981) 

<223> coding for 5- methlythioribose kinase 
<400> 59 

gca cga gca etc etc tec tct cct etc gee ggc gca teg ccc gac tgt 
Ala Arg Ala Leu Leu Ser Ser Pro Leu Ala Gly Ala Ser Pro Asp Cys 
1 5 10 15 

cag tea gec tea gee atg gee gcg gag gag gag cag ggc ttc cgc ccg 
Gin Ser Ala Ser Ala Met Ala Ala Glu Glu Glu Gin Gly Phe Arg Pro 
20 25 30 

ctg gac gag teg tec ctg etc gee tac ate aag gee acg ccg gcg etc 
Leu Asp Glu Ser Ser Leu Leu Ala Tyr lie Lys Ala Thr Pro Ala Leu 
35 40 45 

gee tec cgc etc ggc ggc ggt ggc agt eta gac tec ate gag ate aag 
Ala Ser Arg Leu Gly Gly Gly Gly Ser Leu Asp Ser He Glu He Lys 
50 ^ 55 60 

gag gtc ggc gac ggc aac etc aac ttc gtc tac ate gtg cag tec gag 
Glu Val Gly Asp Gly Asn Leu Asn Phe Val Tyr He Val Gin Ser Glu 
65 ^ " 70 75 80 

gee ggc gec ate gtc gtc aag cag gcg etc ccg tac gtg cgc tgc gtg 
Ala Gly Ala He Val Val Lys Gin Ala Leu Pro Tyr Val Arg Cys Val 

85 90 95 

ggg gat teg tgg ccc atg acg egg gag cgc gee tac ttc gag gee tec 
Gly Asp Ser Trp Pro Met Thr Arg Glu Arg Ala Tyr Phe Glu Ala Ser 
100 105 HO 

acg ctg egg gag cac ggc cgc ctg tgc ccg gag cac ace ccc gag gtg 
Thr Leu Arg Glu His Gly Arg Leu Cys Pro Glu His Thr Pro Glu Val 
115 120 125 



13920 
13980 
14040 
14100 
14160 
14184 



tac cac ttc gac egg acc 
Tyr His Phe Asp Arg Thr 
130 

ccc ccg cac ate ate etc 
Pro Pro His He He Leu 
145 150 

ccg ctg etc gee gac cac 
Pro Leu Leu Ala Asp His 
165 



ttg teg ctg atg ggg atg cgc tac ate gag 
Leu Ser Leu Met Gly Met Arg Tyr He Glu 
135 140 

cgc aag ggc etc gtc gec ggt gtc gag tac 
Arg Lys Gly Leu Val Ala Gly Val Glu Tyr 
155 160 

atg tec gat tac atg gec aag acg etc ttc 
Met Ser Asp Tyr Met Ala Lys Thr Leu Phe 
170 175 



ttc acc tec etc etc tat aac aat acc acg gat cat aag aac gga gtt 
Phe Thr Ser Leu Leu Tyr Asn Asn Thr Thr Asp His Lys Asn Gly Val 
180 185 190 



48 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 
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get aag tac tct gcg^ac gtg gag atg tgt agg etc acg gag caa gtt 624 
Ala Lys Tyr Ser Ala Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val 
195 200 205 

gtg ttc teg gac cca tac cgt gtt tec aaa ttt aat egg tgg ace teg 672 
Val Plie Ser Asp Pro Tyr Arg Val Ser Lys Phe Asn Arg Trp Thr Ser 
210 215 220 

cct tat etc gac aaa gat get gag gca gtt cgc gag gat gat gag etc 720 
Pro Tyr Leu Asp Lys Asp Ala Glu Ala Val Arg Glu Asp Asp Glu Leu 
225 230 235 240 

aag ttg gaa gta get ggg ctg aaa teg atg ttt ate gag aga get caa 7 68 
Lys Leu Glu Val Ala Gly Leu Lys Ser Met Phe lie Glu Arg Ala Gin 
245 250 255 

get ctg att cat gga gat etc cac act ggt tct ate atg gtg acc gaa 816 
Ala Leu lie His Gly Asp Leu His Thr Gly Ser lie Met Val Thr Glu 
260 265 270 

gtt caa etc aag tea ttg ate cag aat ttg ggt tct atg ggg cca atg 864 
Val Gin Leu Lys Ser Leu lie Gin Asn Leu Gly Ser Met Gly Pro Met 
275 280 285 

ggg ttt gat att ggg age ctt cct tgg aaa cct gat ttt ggg cat act 912 
Gly Phe Asp He Gly Ser Leu Pro Trp Lys Pro Asp Phe Gly His Thr 
290 295 300 

atg cac aga atg ggc atg ctg ate aag cga atg ate gta agg ctt aca 960 
Met His Arg Met Gly Met Leu He Lys Arg Met lie Val Arg Leu Thr 
305 310 315 320 

aga atg gat ctt gaa gac aat tgaagagtcg tggaatttgt tccacaaaaa 1011 
Arg Met Asp Leu Glu Asp Asn 
325 

<210> 60 
<211> 327 
<212> PRT 
<213> Zea mays 

<400> 60 

Ala Arg Ala Leu Leu Ser Ser Pro Leu Ala Gly Ala Ser Pro Asp Cys 
15 10 15 

Gin Ser Ala Ser Ala Met Ala Ala Glu Glu Glu Gin Gly Phe Arg Pro 
20 25 30 

Leu Asp Glu Ser Ser Leu Leu Ala Tyr He Lys Ala Thr Pro Ala Leu 
35 40 45 

Ala Ser Arg Leu Gly Gly Gly Gly Ser Leu Asp Ser He Glu He Lys 
50 55 60 

Glu Val Gly Asp Gly Asn Leu Asn Phe Val Tyr He Val Gin Ser Glu 
65 70 75 80 

Ala Gly Ala He Val Val Lys Gin Ala Leu Pro Tyr Val Arg Cys Val 

85 90 95 

Gly Asp Ser Trp Pro Met Thr Arg Glu Arg Ala Tyr Phe Glu Ala Ser 
100 105 110 

Thr Leu Arg Glu His Gly Arg Leu Cys Pro Glu His Thr Pro Glu Val 
115 120 125 

Tyr His Phe Asp Arg Thr Leu Ser Leu Met Gly Met Arg Tyr He Glu 
130 135 140 
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Pro Pro His lie Ile^eu Arg Lys Gly Leu Val Ala Gly Val Glu Tyr 
145 150 155 160 

Pro Leu Leu Ala Asp His Met Ser Asp Tyr Met Ala Lys Thr Leu Phe 
165 170 175 

Phe Thr Ser Leu Leu Tyr Asn Asn Thr Thr Asp His Lys Asn Gly Val 
180 185 190 

Ala Lys Tyr Ser Ala Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val 
195 200 205 

Val Phe Ser Asp Pro Tyr Arg Val Ser Lys Phe Asn Arg Trp Thr Ser 
210 215 220 

Pro Tyr Leu Asp Lys Asp Ala Glu Ala Val Arg Glu Asp Asp Glu Leu 
225 230 235 240 

Lys Leu Glu Val Ala Gly Leu Lys Ser Met Phe lie Glu Arg Ala Gin 
245 250 255 

Ala Leu lie His Gly Asp Leu His Thr Gly Ser lie Met Val Thr Glu 
260 265 270 

Val Gin Leu Lys Ser Leu lie Gin Asn Leu Gly Ser Met Gly Pro Met 
275 280 285 

Gly Phe Asp lie Gly Ser Leu Pro Trp Lys Pro Asp Phe Gly His Thr 
290 295 300 

Met His Arg Met Gly Met Leu lie Lys Ax^g Met lie Val Arg Leu Thr 
305 310 315 320 

Arg Met Asp Leu Glu Asp Asn 
325 



<210> 61 
<211> 471 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (2) . . (469) 

<223> coding for 5- methlythioribose kinase 
<400> 61 

a ttt ccg ggt cga cga ttt cgt ggc aat etc aac ttc gtt ttc ate gtc 49 
Phe Pro Gly Arg Arg Phe Arg Gly Asn Leu Asn Phe Val Phe lie Val 
15 10 15 

ate gga tec act ggc tea etc gtc ate aaa cag gcg ctt ccg tat ata 97 
He Gly Ser Thr Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He 
20 25 30 

cgt tgt att ggg gag tct tgg cca atg acg aaa gaa aga get tac ttt 145 
Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe 
35 40 45 

gaa get aca act ctg aga aag cac gga get ttg tct cct gat cat gtt 193 
Glu Ala Thr Thr Leu Arg Lys His Gly Ala Leu Ser Pro Asp His Val 
50 55 60 

cct gaa gtc tac cat ttt gac agg ace atg get ttg att gga atg agg 241 
Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg 
65 70 75 80 
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tat ctg gag cct ccWac ate ate etc cgc aaa gga etc grt get gga 2 89 
Tyr Leu Glu Pro Pro His He He Leu Arg Lys Gly Leu Val Ala Gly 

85 90 95 

ate cag tac cct ttc ctt gca gaa cac atg get gat tac atg gec aaa 337 
He Gin Tyr Pro Phe Leu Ala Glu His Met Ala Asp Tyr Met Ala Lys 
100 105 110 

ace etc ttc ttc act teg etc etc tat cat gat ace aca gag cac aaa 385 
Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp Thr Thr Glu His Lys 
115 120 125 

aga gca gta acc gag ttt tgt ggt aat gtg gag tta tgc egg tta acg 433 
Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu Leu Cys Arg Leu Thr 
130 135 140 

gag caa gta gtg ttc tct gac ccg tat aga gtt tct ag 471 
Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val Ser 
145 150 155 

<210> 62 
<211> 156 
<212> PRT 

<213> Brassica napus 
<400> 62 

Phe Pro Gly Arg Arg Phe Arg Gly Asn Leu Asn Phe Val Phe He Val 
15 10 15 

He Gly Ser Thr Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He 
20 25 30 

Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe 
35 40 45 

Glu Ala Thr Thr Leu Arg Lys His Gly Ala Leu Ser Pro Asp His Val 
50 55 60 

Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg 
65 70 75 80 

Tyr Leu Glu Pro Pro His He He Leu Arg Lys Gly Leu Val Ala Gly 

85 90 95 

He Gin Tyr Pro Phe Leu Ala Glu His Met Ala Asp Tyr Met Ala Lys 
100 105 110 

Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp Thr Thr Glu His Lys 
115 120 125 

Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu Leu Cys Arg Leu Thr 
130 135 140 

Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val Ser 
145 150 155 



<210> 63 
<211> 415 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (3) . . (413) 

<223> coding for 5- methlythioribose kinase 
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<400> 63 

gg gtc gac gat ttc gtg ctg aga gca aaa gag atg teg ttc gat gag 47 
Val Asp Asp Plie Val Leu Arg Ala Lys Glu Met Ser Phe Asp Glu 
15 10 15 

ttc aag ccg ttg aac gag aaa tct eta gta gag tac ata aag gca acg 95 
Phe Lys Pro Leu Asn Glu Lys Ser Leu Val Glu Tyr lie Lys Ala Thr 

20 25 30 

cct gec etc tec tec agg etc gga gac aag tac gat gat ctg gtc ate 143 
Pro Ala Leu Ser Ser Arg Leu Gly Asp Lys Tyr Asp Asp Leu Val lie 
35 40 45 

aag gaa gtt gga gat ggc aat etc aac ttc gtt ttc ate gtt gtc gga 191 
Lys Glu Val Gly Asp Gly Asn Leu Asn Phe Val Phe lie Val Val Gly 
50 55 60 

tec act ggc tea etc gtc ate aaa cag gcg ctt ccg tat ata cgt tgt 239 
Ser Thr Gly Ser Leu Val lie Lys Gin Ala Leu Pro Tyr lie Arg Cys 
65 70 75 

att gga gaa tea tgg cca atg acg aaa gaa aga get tac ttt gaa gca 287 
He Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe Glu Ala 
80 85 90 95 

aca act ctg aga aag cac ggt ggt ttg tct ccg gat cat gtt cct gaa 335 
Thr Thr Leu Arg Lys His Gly Gly Leu Ser Pro Asp His Val Pro Glu 
100 105 110 

gtc tac cat ttt gac aga ace atg get ttg att gga atg aga tac etc 383 
Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg Tyr Leu 
115 120 125 

gag cct cct cac ate ate etc cgc aaa gga ct 415 
Glu Pro Pro His lie He Leu Arg Lys Gly 
130 135 

<210> 64 
<211> 137 
<212> PRT 

<213> Brassica napus 
<400> 64 

Val Asp Asp Phe Val Leu Arg Ala Lys Glu Met Ser Phe Asp Glu Phe 
15 10 15 

Lys Pro Leu Asn Glu Lys Ser Leu Val Glu Tyr He Lys Ala Thr Pro 
20 25 30 

Ala Leu Ser Ser Arg Leu Gly Asp Lys Tyr Asp Asp Leu Val He Lys 
35 40 45 

Glu Val Gly Asp Gly Asn Leu Asn Phe Val Phe He Val Val Gly Ser 
50 55 60 

Thr Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He Arg Cys He 
65 70 75 80 

Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe Glu Ala Thr 

85 90 95 

Thr Leu Arg Lys His Gly Gly Leu Ser Pro Asp His Val Pro Glu Val 
100 105 110 

Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg Tyr Leu Glu 
115 120 125 

Pro Pro His He He Leu Arg Lys Gly 
130 135 
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<210> 65 

<211> 424 

<212> DNA 

<213> Oryza sativa 

<220> 

<221> CDS 

<222> (3) . . (422) 

<223> coding for 5- methlythioribose kinase 
<400> 65 

cc ctt etc tac aac tec acc act gat cac aag aaa gga gtt get cag 47 
Leu Leu Tyr Asn Ser Thr Thr Asp His Lys Lys Gly Val Ala Gin 
15 10 15 

tac tgc gat aat gtg gag atg tgt agg etc aca gag caa gtc gtg ttc 95 
Tyr Cys Asp Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val Val Phe 

20 25 30 

tea gac cca tac atg etc gec aaa tac aat cgt tgc aca tea ccc ttc 143 
Ser Asp Pro Tyr Met Leu Ala Lys Tyr Asn Arg Cys Thr Ser Pro Phe 
35 40 45 

eta gat aat gat get gca gcg gtt cga gag gat get gag ctt aaa ttg 191 
Leu Asp Asn Asp Ala Ala Ala Val Arg Glu Asp Ala Glu Leu Lys Leu 
50 55 60 

gag att get gaa ttg aaa tea atg ttt att gag aga gca cag get ctt 239 
Glu lie Ala Glu Leu Lys Ser Met Phe He Glu Arg Ala Gin Ala Leu 
65 70 75 

ctt cat gga gat etc cac act ggt tec ate atg gtg aca cca gat tct 2 87 
Leu His Gly Asp Leu His Thr Gly Ser He Met Val Thr Pro Asp Ser 
80 85 90 95 

act caa gtg att gat cca gaa ttt get ttc tat ggc cca atg ggt tac 3 35 
Thr Gin Val He Asp Pro Glu Phe Ala Phe Tyr Gly Pro Met Gly Tyr 
100 105 110 

gac att ggg gee ttc ctg ggg aac ttg att ttg gca tat ttt tea caa 3 83 
Asp He Gly Ala Phe Leu Gly Asn Leu He Leu Ala Tyr Phe Ser Gin 
115 120 125 

gat gga cac get gat caa gca aat gat cgt aag get tac aa 424 
Asp Gly His Ala Asp Gin Ala Asn Asp Arg Lys Ala Tyr 
130 135 140 

<210> 66 
<211> 140 
<212> PRT 

<213> Oryza sativa 
<400> 66 

Leu Leu Tyr Asn Ser Thr Thr Asp His Lys Lys Gly Val Ala Gin Tyr 
1 5 10 15 

Cys Asp Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val Val Phe Ser 
20 25 30 

Asp Pro Tyr Met Leu Ala Lys Tyr Asn Arg Cys Thr Ser Pro Phe Leu 
35 40 45 



Asp Asn Asp Ala Ala Ala Val Arg Glu Asp Ala Glu Leu Lys Leu Glu 
50 55 60 
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# # 

* lie Ala Glu Leu Lys^Ser Met Phe lie Glu Arg Ala Gin Ala Leu Leu 
65 70 75 80 

His Gly Asp Leu His Thr Gly Ser lie Met Val Thr Pro Asp Ser Thr 

85 90 95 

Gin Val lie Asp Pro Glu Phe Ala Phe Tyr Gly Pro Met Gly Tyr Asp 
100 105 110 

lie Gly Ala Phe Leu Gly Asn Leu lie Leu Ala Tyr Phe Ser Gin Asp 
115 120 125 

Gly His Ala Asp Gin Ala Asn Asp Arg Lys Ala Tyr 
130 135 140 



<210> 67 

<211> 404 

<212> DNA 

<213> Glycine max 

<220> 

<221> CDS 

<222> (3) . . (404) 

<223> coding for 5- methlythioribose kinase 
<400> 67 

ta ate ccc gaa cat gtt cct gaa gtg tat cac ttt gac cgt acc atg 47 
lie Pro Glu His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met 
15 10 15 

tct ttg ate ggt atg cgt tac ttg gag ccc cca cat ata ate etc ata 95 
Ser Leu lie Gly Met Arg Tyr Leu Glu Pro Pro His lie lie Leu lie 

20 25 30 

aaa ggg ttg att get ggg att gag tac cct ttt ttg get gaa cac atg 143 
Lys Gly Leu lie Ala Gly lie Glu Tyr Pro Phe Leu Ala Glu His Met 
35 40 45 

get gat ttc atg gcg aag aca etc ttc ttc acg tct ctg ctt ttc cgt 191 
Ala Asp Phe Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Phe Arg 
50 55 60 

tec act get gac cac aaa egg gac gtt gee gaa ttt tgt ggg aat gtg 239 
Ser Thr Ala Asp His Lys Arg Asp Val Ala Glu Phe Cys Gly Asn Val 
65 70 75 

gag tta tgc agg etc act gaa cag gtc gtt ttc tct gac cct tat aaa 2 87 
Glu Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Lys 
80 85 90 95 

gtt tct caa tat aat cgt tgg act tec ccc tat ctt gat cgt gat get 335 
Val Ser Gin Tyr Asn Arg Trp Thr Ser Pro Tyr Leu Asp Arg Asp Ala 
100 105 110 

gag get gtt egg gaa gac aat ctg ctg aag ctt gaa gtt get gag ctg 383 
Glu Ala Val Arg Glu Asp Asn Leu Leu Lys Leu Glu Val Ala Glu Leu 
115 120 125 

aaa tec aag ttc att gag age 404 
Lys Ser Lys Phe He Glu Ser 
130 

<210> 68 

<211> 134 

<212> PRT 

<213> Glycine max 
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<400> 68 

lie Pro Glu His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ser 
15 10 15 

Leu lie Gly Met Arg Tyr Leu Glu Pro Pro His lie lie Leu lie Lys 
20 25 30 

Gly Leu lie Ala Gly lie Glu Tyr Pro Phe Leu Ala Glu His Met Ala 
35 40 45 

Asp Phe Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Phe Arg Ser 
50 55 60 

Thr Ala Asp His Lys Arg Asp Val Ala Glu Phe Cys Gly Asn Val Glu 
65 70 75 80 

Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Lys Val 

85 90 95 

Ser Gin Tyr Asn Arg Trp Thr Ser Pro Tyr Leu Asp Arg Asp Ala Glu 
100 105 110 

Ala Val Arg Glu Asp Asn Leu Leu Lys Leu Glu Val Ala Glu Leu Lys 
115 120 125 

Ser Lys Phe lie Glu Ser 
130 



<210> 69 
<211> 21 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz : 
oligonucleotide primer 

<400> 69 

cgtgaatacg gcgtggagtc g 21 

<210> 70 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 70 

cggcaggata atcaggttgg 20 

<210> 71 
<211> 20 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



<400> 71 

gtcaacgtaa ccaaccctgc 



20 



